爬虫

2020-12-22  本文已影响0人  唐人三藏

一、动态网址跟静态网址

网址中有问号,为动态网址

二、HTTP响应:

服务端返回给客户端,分为三部分:

响应状态码:r.status_code,查看返回响应码

响应头

响应体

三、使用requests爬取动态网站

四、伪装客户端——添加Headers

在请求头中,User-Agent项会记录用户的使用系统和浏览器版本,需要改造伪装成一个普通的用户

添加Headers,该类型为字典,不是字符串

上一篇 下一篇

猜你喜欢

热点阅读