爬虫之浏览器抓包教程-升级版
2021-05-04 本文已影响0人
八维数据
早前 我 写 过 一 篇 淘宝详情页抓包 教 程,不过之前 流程还是 有点不完善,所以今天 在写一篇 浏览器抓包升级版教程了。
整备工具:2345浏览器,360浏览器 等(大部分浏览器都有抓包功能的)。
测试网址:https://www.tripadvisor.cn/Restaurants-g294265-Singapore.html
START:
按上面图操作即可,简单说明一下,打开网站------->按 F12 快捷键 ----->跳出对话框-----> 点击Network ------>点击 清空符号----->点击网站中的分页数字。
这里就是抓包后,下面对话框出现的效果了,然后我们在网站里随便找一个产品的链接如图提取后的链接:https://www.tripadvisor.cn/Restaurant_Review-g294265-d14157093-Reviews-Anglo_Indian_Cafe_Bar_Chijmes-Singapore.html
我们把这个链接后面的部分信息 Restaurant_Review-g294265-d14157093 提取出来,在抓包的信息里进行搜索,查看这个链接出现在那个数据包中。
到这里基本可以知道了这个抓包数据的信息在哪里了。
因为这个网站特殊性,具体这个内容怎么采集,我这边就不叙述了,这里只介绍用简单的浏览器直接抓包的方法。
后面有需要采集学习,或者采集要求的朋友可以留言哦。