用Python写的开源爬虫网站，秒搜所有豆瓣好书

2019-06-19 本文已影响4人烟雨丿丶蓝

程序员在提升自己的道路，大多还是会选择阅读编程书籍这一途径，但找到一本好书就没那么容易了。

通过查看各大销售网站的销量数据和评价，以及豆瓣评分和评价人数，可以帮助我们更快的挖掘出经典的计算机书籍，还有那些被人们忽视的好书。

最近在GitHub上发现了一个网站，是中国科学院自动化研究所的一大神(lanbing510)用Python写的一个爬虫，他在16年的时候就爬下了豆瓣所有的读书数据并做了个WebApp接口方来挖掘查找和阅读好书。怪我知道的太晚

image

后来lanbing510再次爬了一遍豆瓣读书的数据，总共更新了3232088本图书信息，共2138386KB，并将其开源

为什么说它很好用呢?猿哥演示一遍你就知道了：

image

可以看出这网站的界面非常简洁，没有花里花哨的内容，只有干货，你可以直接通过关键字、分数、和评价人数这三个选项进行搜索，比如我们可以搜索关键字：编程;分数：9.0;评价人数：100人以上

查找结果的显示方式有按照分数排序和人数排序两种，按照分数排序的截图如下：

image

按照评价人数排序的截图如下：

image

除了以上演示的操作，这个网站并实现了以下功能：

在这推荐下小编创建的Python学习交流群835017344，可以获取Python入门基础教程，送给每一位小伙伴，这里是小白聚集地，每天还会直播和大家交流分享经验哦，欢迎初学和进阶中的小伙伴。

也就是说你不仅可以在网站上搜索，还能通过下载各类目下的Excel书单文件，直接在Excel中搜索

image

效果截图如下：

image