Python爬虫笔记

python爬虫day-5(代理的基本原理)

2019-04-10  本文已影响0人  南音木

个人学习笔记,方便自己查阅,仅供参考,欢迎交流

代理的基本原理

网站会采取一些反爬虫措施。比如,服务器会检测某个IP在单位时间内的请求次数,如果超过了阀值,就会直接拒绝服务,返回错误信息,这种情况可以称为封IP。一种有效的方式就是使用代理,伪装我们的IP,让服务器识别不出是由我们本机发起的请求。

A.基本原理
B.代理的作用
C.爬虫代理

使用代理隐藏真实的IP,让服务器误以为是代理服务器在请求自己,这样在爬取过程中通过不断更换代理,就不会被封锁,可以达到很好的爬取效果。

D.代理分类

1.根据协议区分

2.根据匿名程度区分

E.常见代理设置
上一篇 下一篇

猜你喜欢

热点阅读