爬虫小技巧:绕开登陆和访问频率控制

2019-05-21  本文已影响0人  是东东
更换referer。

有的网站为了SEO流量,而把referer来自百度的访问控制放宽了一样。
有的产品为了微信的流量(分享到微信里的页面可以直接打开,点击其他页面时再提示要注册登录),而对来自微信点击访问控制放宽了。

曾经我想要某职业社交APP里的一些用户详细页的信息用来做分析,但是面临如下问题:

抓取思路

使用10个账号按一定频次通过APP不停的获取每个用户详细页分享到微信的URL,让另外一个程序模仿微信的user-agent不停的访问这些分享到微信的URL(要使用adsl拨号来解决单个IP访问频率控制问题)。

这样通过app加微信的方式解决了对账号的限制问题,实现了曲线救国。

上一篇 下一篇

猜你喜欢

热点阅读