py爬虫

scrapy +chrome 抓取考拉动态详情信息并把图片保存到

2017-06-01  本文已影响107人  a十二_4765

scrapy 安装自己百度

1.对网站进行分析

使用xpath 进行分析

response.xpath('//div[@class="goodsWrap clearfix"]/div[@class="detailWrap clearfix"]/a/@href').extract() 获得地址进入

或得内容页的图片 

详情页是动态的所以得调用 chrome 浏览器

因为没有ip限制 所以无需反爬虫

上一篇下一篇

猜你喜欢

热点阅读