抖音爬虫从0到1-第一弹:环境配置

2021-01-07  本文已影响0人  雪中的猫

相关文章:
抖音 x-gorgon 03 免费生成接口 抖音6.3.0版本:

前言

该系列内容主要介绍抖音爬虫的相关过程。因为科研需要,所以选择爬取抖音的视频数据,包括点赞等。爬取思路是首先爬取用户,然后根据用户爬取其对应发布的视频数据。这一个博客我将介绍环境配置。 如果需要获取对应的安装包,请留言


一、抓包软件

1. 抓包软件选择

这里使用的抓包软件是:Fiddle,因为最新版本的Fiddle比较奇怪,所以我还是选择使用老版本的Fiddle(5.0版本)。

2. 抓包软件配置

2.1. 安装

这里没有什么需要注意的

2.2. 配置

点击Tools -> Options,就可以看到Options的主面板

Options General下的东西一般不用变

在Options的主面板中,点击 Https,设置捕获HTTPS的包等,详见下图

设置能够抓HTTPS包

点击Actions -> Trust Root Certificate,为电脑安装证书:

安装证书 安装整数

这样就在电脑端装好了证书


安装证书

在Options的主面板中,点击 Connections,设置连接规则等。包括端口号的设定,一定要记得选中允许远程电脑连接,我们就可以使用这个作为手机的代理,从而抓取手机的包了。

连接设置

二、手机设置

1. 抖音版本选择

试了好多版本的抖音,发现6.3.0版本的最好抓包,所以我就使用了6.3.0版本的抖音,大家如果需要的话可以关注公众号获取安装包

2. 配置手机网络

2.1. 保证手机和电脑在同一个局域网内

使用同一个路由器下的网络就行,学校内网应该也是可以的,或者没有路由器的话,用另一个手机开热点给它俩连也可以


在这里插入图片描述

2.2. 设置手机代理

手机代理设置 手机代理设置

这个时候手机代理就设置好了,如果以上步骤都没有问题的话,这个时候应该已经可以联网了,可以用手机上一下百度,测试一个,如果不可以联网,检查一下你的手机网络代理设置是不是正确的:(电脑ip正确不,前面设置的Fiddle的Options里面的Connetions里面的端口是不是和手机上设置的一样),如果没问题,建议重启一下手机,我的手机连不上网的时候重启一下就好了,然后连接网络,然后就可以上网了。

因为要爬HTTPS 的包,所以需要安装证书,前面已经知道了你的电脑的ip地址,还有fiddle中设置的端口号,在手机浏览器中输入:http://电脑ip:端口号,例如你的电脑的ip是192.168.0.1,设置的端口号是:8888,那么你就要输入:http://192.168.0.1:8888
如果上一步你的代理设置成功了,那么就会出现这个页面:
点击下载证书,然后安装,过程如下:

手机安装证书

到这里手机就安装好证书了,这个时候打开抖音,我们可以看到Fiddle已经可以抓到抖音的数据包了


抖音抓包数据

上面的图就是抖音某用户发布的视频的抓包,我们可以通过分析请求头以及对应的响应获取我们想要的数据了。

总结

以上就是抖音抓包的环境配置阶段,后面我会具体讲解怎么抓取用户信息,视频数据等,码字不易,还请点赞关注,有任何问题请留言,或者关注下方微信公众号获取抖音安装包以及Fiddle安装包等。

last but not least

任何问题,或者想要获取对应的抖音APK抓包软件,请留言

上一篇 下一篇

猜你喜欢

热点阅读