python 六节课 爬虫 1-3

2018-04-22  本文已影响0人  任我笑笑

url

https://www.bilibili.com/video/av19689660/?p=1

课程

第一节课 ,简介 ,基本多余
第二节课 ,前半 多余 ,后半 ,开始 讲requests 模块,进入正式代码部分

正确的步骤

requests 模块

response的方法

发送post请求

不加header的情况下,下面的代码足矣,但是因为没有header容易被服务器判断为爬虫而不响应。

image.png

header的东西,可以用chrome来查看


image.png

普通情况下只加user-agent就可以

使用超时参数

retrying模块 需要安装

使用装饰器,出错情况下运行3次


image.png

cookie

image.png image.png image.png

如何找到正确的form提交url

观察chrome的network的时候
为了防止页面跳转而导致各种请求信息消失,
可以勾选 preserve log

  1. 在html的form代码中找提交的action的url
上一篇下一篇

猜你喜欢

热点阅读