Python爬虫入门教程 45-100 Charles抓取兔儿故事-下载小猪佩奇故事-手机APP爬虫部分
程序员文章站
2024-01-27 09:07:46
1. Charles抓取兔儿故事背景介绍 之前已经安装了Charles,接下来我将用两篇博客简单写一下关于Charles的使用,今天抓取一下兔儿故事里面关于小猪佩奇的故事。 爬虫编写起来核心的重点是分析到链接,只要把链接分析到,剩下的就好办了。 2. 待爬取APP链接分析 夜神模拟器安装APP完毕, ......
1. charles抓取兔儿故事背景介绍
之前已经安装了charles,接下来我将用两篇博客简单写一下关于charles的使用,今天抓取一下兔儿故事里面关于小猪佩奇的故事。
爬虫编写起来核心的重点是分析到链接,只要把链接分析到,剩下的就好办了。
2. 待爬取app链接分析
夜神模拟器安装app完毕,之后打开相应的软件,进去到小猪佩奇的分类清单,注意charles,在里面尽量的去找到下图的链接,说白了就是在app翻来翻去,看charles的变化。
在分析中得到如下链接
http://api.tuer123.com/app/android/v1.4/category/detail.html?sort=187&startkey=&x_api_appid=vcdrktfwd4rihfuq&x_api_nonce=a502c9aa0f598887fdef0636fc1f28f4&x_api_sign=f90b1e442038d825f0f1f4ea328cbfce&x_api_time=1547476580
分析参数得到,数据只有3页,可以说是非常少了,当然,如果你去遍历分类页,那再多的故事也是可以得到的
http://api.tuer123.com/app/android/v1.4/category/detail.html?sort=187&startkey=1 http://api.tuer123.com/app/android/v1.4/category/detail.html?sort=187&startkey=2 http://api.tuer123.com/app/android/v1.4/category/detail.html?sort=187&startkey=3
点击链接在右侧得到json数据
获取到url
http://res.tuer123.com/source/voice/1802/357_file_95e14b6690.mp3
3. 编写mp3下载方法
写一个单个音频下载的办法,你自行扩展吧
import requests import time res = requests.get("http://res.tuer123.com/source/voice/1802/357_file_95e14b6690.mp3") content = res.content with open(str(int(time.time()))+".mp3","wb+") as f: f.write(content)
打开默认播放器,当听到我是佩奇
的声音传递而来,表示音频已经下载完毕啦~~