scrapy +chrome 抓取考拉动态详情信息并把图片保存到
2017-06-01 本文已影响107人
a十二_4765
scrapy 安装自己百度
1.对网站进行分析

使用xpath 进行分析
response.xpath('//div[@class="goodsWrap clearfix"]/div[@class="detailWrap clearfix"]/a/@href').extract() 获得地址进入

或得内容页的图片

详情页是动态的所以得调用 chrome 浏览器




因为没有ip限制 所以无需反爬虫