office

用Power Query进行网页抓数

2020-07-07  本文已影响0人  Jeanie

今天讲一个网页抓数的技巧,不需要编程,点点鼠标就行了,不能说特别简单,但是也不复杂啦。

第一步
进入power query
第二步

输入想要抓取数据的网址


输入网址 等着就可以了
第三步
选择需要读取数据的地方 选好了点击load 进去之后长这样
第四步

选择进入高级编辑器

进入到了编辑界面,选择高级编辑器

新建第一行,输入

(page as text)=>

别怕,照着输入就行

在网页的末尾输入

"&page&"

这个就是相当于把页数变成一个变量,然后就可以读取很多页的内容了。一般的网页会在末尾出现数字,就表示页数变量。也有的网页出现在中间,可以点击不同的页数观察一下网址的哪里会有数字的变化,就在那个地方把数字替换成"&page&"。

替换变量

然后选择Done。

第五步

新建一个text文档,在里面输入一串数字。


给变量赋值
第六步

把text文档导入power query


导入 导入 导入 导入后的界面
第七步

设置参数


点击引入自定义函数的按钮 照做就行
隐私设置
选择忽略

这里要等很久,这个时候就是在抓取数据中啦。

第八步

加载出来是这个样子


离成功很近了

点击expand


expand
然后就出来咯!
成功了
第九步

点击这里就会把数据返回到excel里面。


大功告成
上一篇下一篇

猜你喜欢

热点阅读