「爬虫」11爬虫之微信爬虫

2020-01-13  本文已影响0人  林拂晓

1.微信爬虫

    微信爬虫就是,自动获取微信的相关文章的一种爬虫。因为微信对爬虫的限制比较多所以需要采用一些手段解决这些限制,主要包括伪装浏览器、使用代理IP等方式。

2.微信爬虫思路

总体思路:模拟http://weixin.sogo.com/进行定向搜索。

(1)定义函数,实现:伪装浏览器(以google浏览器为例)+代理服务器+异常处理+模拟HTTP请求

解除限制需要利用的手段(通用)

(2)定向爬虫:过滤其它不相关信息,爬取有用信息

微信定向爬虫代码
上一篇 下一篇

猜你喜欢

热点阅读