2.1 文本选择器(Text seclector)--websc

2019-12-02  本文已影响0人  niujw

例子:B站新番榜单

B站新番榜单

还记得我们在前面小节中总结的使用步骤吗?核心点是选对selector

步骤

1 打开插件
2 创建sitemap
3 选择合适的选择器(selector)
4 爬取数据
5 下载CSV数据

详解

1 打开软件

2 创建sitemap

3 选择合适的选择器(selector)

4 抓取数据

4-1 4-4

5 下载数据

问题解释

  1. 为什么选中前两条标题数据 其他的数据也自动被选择上了?
    答:因为在html页面在编写过程中这些数据标题的有一定的共性格式,通过a.title这个前端css属性就可以定位到这些数据内容。所以其他的数据也会被选择上。
  2. 为什么我的文本数据没有被选择上?
    答:首先检查一下你的selector type 是不是选择的text, 其次你在选择数据时的选择位置不对或者错位,多尝试几次就能选中要爬取的数据内容。

遗留问题

1:为什么这些数据展示出来的顺序不一致?
2:如何采集多个数据字段展示?
接下来我们会接着探讨~~

上一篇下一篇

猜你喜欢

热点阅读