爬虫技术分享交流

关于八爪鱼知乎采集模板限定时间的补充说明

2021-09-09  本文已影响0人  jameszhi

知乎的搜索结果提供四个时间限定:

那么我们在采集规则当中,如果想要简单的使用这几个限定应如何做呢?向下看:

当我们搜索时,网址是如下的样子:

https://www.zhihu.com/search?q=关键字&type=content&utm_content=search_history

?后面的我们专业上称之为参数,不同的参数之间用&连接。

当我们选择不同的时间段时,比如我们选择一天内,网址会增加一个参数,如下:

https://www.zhihu.com/search?q=关键字&type=content&utm_content=search_history&range=1d,没错,这个就是时间限定参数。

那么,我们就可以根据这个规律,找到不同的限定条件对应的参数。

具体如下:

一天内:&range=1d

一周内:&range=1w

三月内:&range=3m

而默认的时间不限则没有额外的参数。

那么,我们得到这些参数,如果要使用的话,则可以在规则当中的批量网址处:

后面增加相应的参数即可。

示例如下:

然后我们回到规则的编辑界面,就可以在网页预览中看到参数生效了。

上一篇下一篇

猜你喜欢

热点阅读