欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

抖音爬虫之环境搭建(1)

程序员文章站 2022-05-18 21:25:47
...

安装mitmproxy

抖音爬虫之环境搭建(1)抖音爬虫之环境搭建(1)
安装之后运行mitmdumpy
抖音爬虫之环境搭建(1)默认启动的代理端口为8080

夜神模拟器配置

官网下载最新版即可,j记得安装抖音APP。

安装证书:

打开浏览器输入mitm.it,选择Android,证书名字随意:
抖音爬虫之环境搭建(1)

查看本地主机IP
抖音爬虫之环境搭建(1)

WLAN设置

鼠标左键长按WiredSSID,跳出修改网络代理:手动
抖音爬虫之环境搭建(1)

Windows安装证书

mitmproxy-ca.p12
抖音爬虫之环境搭建(1)
安装方式参考:https://cuiqingcai.com/5391.html

配置完成之后,应该是可以上网的,不能上网请留言

配置完成,测试环境

打开mitmweb

一般在python安装路径Scripts下
比如我的在 D:\Python3.7.5\Scripts\mitmweb.exe
抖音爬虫之环境搭建(1)
Chrome浏览器会弹出来
抖音爬虫之环境搭建(1)

运行APP

发现mitmweb已经截获到了图片数据
抖音爬虫之环境搭建(1)
用户数据
抖音爬虫之环境搭建(1)

新建test.py脚本测试

mitmweb捕获的请求就叫flow

import json

def response(flow):
    if str(flow.request.url).startswith("https://aweme.snssdk.com/aweme/v1/nearby/feed/"):
        index_response_dict = json.loads(flow.response.text)
        aweme_list = index_response_dict.get('aweme_list')
        with open('data.txt', 'a+', encoding='utf-8') as f:
            f.write(str(aweme_list))
            if aweme_list:
                for aweme in aweme_list:
                    print(aweme)

def request(flow):
    pass

开启服务,执行脚本下载数据

mitmdump -s test.py

会执行py脚本

运行某音APP,查看mitmdump
抖音爬虫之环境搭建(1)
可以看到mitmdump不断在截获包
抖音爬虫之环境搭建(1)
data.txt内容也写入
抖音爬虫之环境搭建(1)
data我们可以百度搜索js代码格式化,以格式化显示,显示之后大概这样:
抖音爬虫之环境搭建(1)
至此,我们已经完成了环境的搭建与测试。
接下来,就准备爬取吧!