python爬虫Crawler爬虫系列

新手向爬虫(二)站点分析

2016-11-04  本文已影响1015人  treelake

新手向爬虫(一)利用工具轻松爬取简书并分析中我们初步接触了爬虫,关键在于:

  1. 通过工具获取网页内容选择器
  2. 分析页面元素,是否包含隐藏信息
  3. 利用浏览器的开发者工具分析网络请求

现在让我们对简书站点做一定的分析:

Robots.txt

估算网站大小

识别网站所有者

分析网站所用技术

查看网页编码

参考:Web Scraping with Python —— 用python写网络爬虫

上一篇 下一篇

猜你喜欢

热点阅读