真实世界中的网页解析 2016-08-11 本文已影响0人 海洋之心_ 重点 status_code 200正常 404不正常 间隔抓取,防止反爬措施 import time time.sleep(4) soup.select出来的是列表 定位元素的方法:找唯一特征 连续爬去多页,观察网站上段地址变化 反爬取可以模拟手机爬