python 爬虫思维

2018-05-04 本文已影响0人任我笑笑

url

https://www.bilibili.com/video/av12721444
这视频老师还真是有当网红老师的潜质

先查看源代码中是否还有需要的信息，如果没有
利用chrome来对js加载的url进行跟踪，分析

image.png

120分钟之后都是多余。。。。

headers()是自定义的随机取一个user-agent出来

image.png

执行之后取出要用的json 因为是gbk的，所以要decode('gbk').encode('utf-8')

把json转成dict
from json import loads
loads(xxxx)

image.png

分析url，拼接url

image.png