pythonPython中文社区python机器学习爬虫

爬虫自动设置User-Agent代理,防止爬虫被封

2020-01-19  本文已影响0人  _aLIEz

User-Agent 首部包含了一个特征字符串,用来让网络协议的对端来识别发起请求的用户代理软件的应用类型、操作系统、软件开发商以及版本号。

下面将介绍 fake_useragent 这个库,来随机生成User-Agent供爬虫使用

from fake_useragent import UserAgent
ua = UserAgent()

print(ua.ie)  
print(ua.chrome)  
print(ua.firefox)
print(ua.random)


#生成的User-Agent
Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.15 (KHTML, like Gecko) Chrome/24.0.1295.0 Safari/537.15
Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.93 Safari/537.36
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1664.3 Safari/537.36
Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.15 (KHTML, like Gecko) Chrome/24.0.1295.0 Safari/537.15
from fake_useragent import UserAgent

ua = UserAgent()
user_agent = ua.chrome
headers = {'User-Agent':ua.chrome }
print(headers)


#生成的数据为
{'User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.90 Safari/537.36'}
{'User-Agent': 'Mozilla/5.0 (X11; OpenBSD i386) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1985.125 Safari/537.36'}

上一篇 下一篇

猜你喜欢

热点阅读