爬取Amazon商品销售排行榜

2019-04-22  本文已影响0人  数云智连

概要:

基于python实现Amazon商品排行榜爬取:排名、商品标题、商品链接、星级、评论数、图片链接、价格。关注公众号“数云智连”,回复“亚马逊商品排名”获取下载链接

采集结果数据示例:

一、程序实现步骤
1、打开amazon细分子类排行榜榜单;
以时尚女装为例,排行榜链接为
https://www.amazon.com/Best-Sellers-Womens-Fashion/zgbs/fashion/7147440011/ref=zg_bs_pg_1?ie=UTF8&language=en_US&pg=1

https://www.amazon.com/Best-Sellers-Womens-Fashion/zgbs/fashion/7147440011/ref=zg_bs_pg_1?ie=UTF8&language=en_US&pg=2

2、循环翻页链接

要采哪些页面的数据,直接写到“待采链接.txt"中,这里共两页,如果有多页在采集时,把链接都添加进来 3、循环每个页面的商品模块,采集:排名、商品标题、商品链接、星级、评论数、图片链接、价格

4、存入excel中

数据如下:

二、采集程序使用

1、回复:亚马逊商品排名,获取下载链接,并解压,得到文件

2、将要采的链接写到“待采链接.txt"中,注意一个链接一行

3、双击bin目录下的amazon.exe开始采集(需在win7运行) 4、自动运行程序完成采集

并自动生成:amazon.xls文件,即采集的结果数据。

上一篇下一篇

猜你喜欢

热点阅读