(2/3)如何用PBI导入网页数据
2019-10-30 本文已影响0人
江苏东军
刚才我们成功导入了单页数据,也熟悉了一遍流程。显然单页数据量还达不到数据分析的起步要求,那如何把上述榜单的二十五页明细全部导入呢?
我们在网页的页码链接处前后点几次,观察网址变化就会发现,关键在于网址最后一个数字。
![](https://img.haomeiwen.com/i14698263/8a9e9d559fd233f1.png)
在网页数据导入的所有步骤中,有两个环节最为重要:
a)如何判定链接与网址的对应关系。
b)如何判定网址中哪些是关键字符串。
这两个环节,常规网站一般没什么难度,仔细对比就能找到规律。而有些网页就不那么好对付了(尤其像一些财经类网站,基金/股票的排行榜,可以自己去摸索一下),需要用额外工具来解析,这个不是咱们今天讨论的重点,暂且忽略。
既然找到了关键环节,那问题就简单了。前四个步骤与导入单页数据相同,不再赘述。我们把已导入的数据表重命名(尽量避免出现诸如表1、查询2、函数3,参数4之类的名称)。
多页数据导入的思路:
1)先设定参数。本例固定变化的是页码,因此只需设置一个页码参数即可;
2)再来一个自定义函数;
3)把参数代入函数;
4)展开函数,得到最终结果。