用Power Query进行网页抓数
2020-07-07 本文已影响0人
Jeanie
今天讲一个网页抓数的技巧,不需要编程,点点鼠标就行了,不能说特别简单,但是也不复杂啦。
第一步
进入power query第二步
输入想要抓取数据的网址
输入网址 等着就可以了
第三步
选择需要读取数据的地方 选好了点击load 进去之后长这样第四步
选择进入高级编辑器
进入到了编辑界面,选择高级编辑器新建第一行,输入
别怕,照着输入就行(page as text)=>
在网页的末尾输入
"&page&"
这个就是相当于把页数变成一个变量,然后就可以读取很多页的内容了。一般的网页会在末尾出现数字,就表示页数变量。也有的网页出现在中间,可以点击不同的页数观察一下网址的哪里会有数字的变化,就在那个地方把数字替换成"&page&"。
替换变量然后选择Done。
第五步
新建一个text文档,在里面输入一串数字。
给变量赋值
第六步
把text文档导入power query
导入 导入 导入 导入后的界面
第七步
设置参数
点击引入自定义函数的按钮 照做就行
隐私设置
选择忽略
这里要等很久,这个时候就是在抓取数据中啦。
第八步
加载出来是这个样子
离成功很近了
点击expand
expand
然后就出来咯!
成功了
第九步
点击这里就会把数据返回到excel里面。
大功告成