Java 杂谈python爬虫

20行代码的爬虫爬取1000张车模

2019-07-30  本文已影响35人  躺着写代码

近日,团队内部需要做一次爬虫技术的分享,决定手写一个美女图片爬取程序。第一次写文章,希望大家能够多多指教,也能够相互学习。立帖为证!!!


目的:

1、提高大家的学习兴趣

2、展现出自我强大编程功底(哈哈)

技术:

1、java8  (stream、Lambda)

2、webmagic爬虫框架

3、xpath、jsoup文档解析


源码:

说明:

1、startUrl为7160网站的分类入口地址

2、dir是你需要存放路径

3、目录下拆分32子目录,避免单个文件数太多

源码地址:https://github.com/jiamin13579/spider-demo

上一篇 下一篇

猜你喜欢

热点阅读