工具@IT·互联网首页投稿(暂停使用,暂停投稿)

一个爬freebuf所有历史文章的爬虫

2016-08-20  本文已影响502人  红绯鱼

Freebuf-Spider

一个抓取freebuf所有栏目的文章的爬虫,以离线网页形式展现,上传了一些爬取好的结果

程序运行方式

  python freebuf.py
http://www.freebuf.com/sectool    -->
http://www.freebuf.com/sectool/page/100

如果返回是


说明这个栏目没有这么多页,写程序的二分法不用我教吧,用这个方法可以快速得出总页数,然后填上即可

需要模块

  import requests
  import re
  import urllib

输出结果

暂时爬取了三个栏目放在这里,大家可以看下效果,自己可以动手爬其他的

终端安全

可以看到freebuf终端安全的文章从建站到现在全部在这里了

安全工具合集

下载

程序和生成结果在这里下载!

各位给个star吧(●'◡'●)

上一篇 下一篇

猜你喜欢

热点阅读