50行Python代码轻松爬取抖音APP短视频,用心你就能学会
基本环境配置

版本:Python3
系统:Windows
相关模块:
<pre style="-webkit-tap-highlight-color: transparent; box-sizing: border-box; font-family: Consolas, Menlo, Courier, monospace; font-size: 16px; white-space: pre-wrap; position: relative; line-height: 1.5; color: rgb(153, 153, 153); margin: 1em 0px; padding: 12px 10px; background: rgb(244, 245, 246); border: 1px solid rgb(232, 232, 232); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-align: start; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">from mitmproxy import ctx
import json
import requests
import time
import os
</pre>
Charles获取视频接口
爬取之前先将手机与PC至于同局域网并确保手机WIFI的代理端口为8888,然后打开Charles获取视频请求的链接,如图:
手动上滑触发视频请求接口
自动化滑动刷新有尝试过,但是由于技术有限,不能实现抖音APP的登录,所以用Charles只能获取视频下载链接,而不能获取其他有效信息,比如视频的名称、作者名称、获赞数、转发量等。
Python脚本获取视频信息
使用Python脚本拦截response爬取视频信息并下载视频,同时将视频信息存储至JSON。
视频无水印
如图:
PS:获取的数据不能直接存储至MongoDB等数据库,具体原因尚不清楚,若您知道,可以私信我