《超详细的python爬虫入门，从 requests 到 scrapy》专题

超详细的python爬虫入门，从 requests 到 scrapy

本专题以项目为驱动，从基本的网络请求和页面解析开始，逐步深入到 scrapy爬虫框架，在讲解完库之后，会跟上对应的实践项目，有兴趣朋友的可以跟着实践自己敲代码或者完成我留下的 bug，把代码发到评论区，我会不定时查看。

本专题假设读者有一定的python基础，所以并不会讲python的基本语法，遇到语法问题可以评论求助。

因为本专题涉及的库比较多，而且作者不能把时间全部用在更新上，所以本专题完成的时间可能较长，在本专题中会涉及到以下主题：
1、requests 库
（网络请求）
2、lxml 库和 xpath 用法
（htnl页面解析）
4、html 网页的解析
5、数据的处理和存储（json，csv）
6、threading 库（多线程）
7、asyncio 库（异步）
8、数据库以及 orm
9、scrapy 爬虫框架

在写这些的时候，我也在不断地学习，如果我在学习的过程中发现了更好的库，就会换一个库讲，但是上面所列的点是不会变的。

最后，如果在文章中出现了错误，欢迎在评论中指出，我会在后续的更新中修改。

谢谢

python爬虫小工具--快速获得请求头
Scrapy初体验
scrapy爬虫框架（四）：scrapy中 yield使用详解
scrapy爬虫框架（三）：爬取壁纸保存并命名
scrapy爬虫框架（一）：scrapy框架简介
实战：异步爬取之异步的简单使用
实战：异步爬取之初识异步
实战：简书爬取之多线程爬取（二）速度提升何止10倍
实战：爬取简书之多线程爬取（一）
占位文章，无内容--简书爬取之断点续爬
实战：爬取简书之搭建程序框架
一个大胆的想法，爬取简书所有的文章信息
python爬虫系列之数据存储实战：爬取简书用户文章列表并保存
python爬虫系列之数据的存储（二）：csv库的使用
python爬虫系列之数据的存储（一）：json库的使用
python爬虫系列之 html页面解析：如何写 xpath路径
python爬虫系列之 xpath实战：批量下载壁纸
python爬虫系列之 xpath：html解析神器
python爬虫系列之 requests实战：用 request
python爬虫系列之 requests: 让 HTTP 服务人

超详细的python爬虫入门，从 requests 到 scrapy

延伸阅读