Python 爬取喜马拉雅音频

程序员文章站 2022-10-04 22:31:21

一、分析音频下载相关链接地址 1. 分析专辑音频列表页面在 PC端用 Chrome 浏览器中打开喜马拉雅网站，打开 Chrome开发者工具，随意打开一个音频专辑页面，Chrome开发者工具中返回如下图结果：经过分析专辑音频列表地址为 https ......

一、分析音频下载相关链接地址

1. 分析专辑音频列表页面

在 PC端用 Chrome 浏览器中打开喜马拉雅网站，打开 Chrome开发者工具，随意打开一个音频专辑页面，Chrome开发者工具中返回如下图结果：

Python 爬取喜马拉雅音频

经过分析专辑音频列表地址为

其中:

albumId 专辑ID

pageNum 页号

返回的页面内容是 json 格式，相比于 html 源码，json 还是很容易处理的，下载音频只需要用到如下参数：

tracks 音频信息列表

tracks -> title 音频标题

tracks -> trackId 音频ID

2. 分析音频下载链接地址

随意播放一个音频，在Chrome开发者工具中返回如下图结果：

Python 爬取喜马拉雅音频

经过分析专辑音频下载链接为

其中

trackIds 音频ID

返回的页面内容也是 JSON 格式，其中 tracksForAudioPlay 字段包含了音频的相关信息，其 src 就是音频下载地址。

src 音频下载链接

trackName 音频名称

trackId 音频ID

二、编写代码

1. 安装相关依赖模块

本程序使用 requests 访问 web 页面，因此需要安装 requests 模块

pip install requests

2. 编写代码

提取专辑内的音频列表信息，如下：

Python 爬取喜马拉雅音频

提取音频下载地址，如下：

Python 爬取喜马拉雅音频

下载音频文件，如下：

Python 爬取喜马拉雅音频

完整源码：

Python 爬取喜马拉雅音频

上一篇：课时36：类与对象：给大家介绍对象

下一篇： Swoole 理解manager进程和worker进程的启动顺序，以及演示如何停止或者重启服务端。

Python 爬取喜马拉雅音频

一、分析音频下载相关链接地址

1. 分析专辑音频列表页面

2. 分析音频下载链接地址

二、编写代码

1. 安装相关依赖模块

2. 编写代码

通过抓取淘宝评论为例讲解Python爬取ajax动态生成的数据(经典)

python爬取网页内容转换为PDF文件

Python使用Selenium爬取淘宝异步加载的数据方法

网易云歌单信息爬取及数据分析（python爬虫）

python爬取个性签名的方法

python如何爬取个性签名

Python实现爬取马云的微博功能示例

Python爬取Coursera课程资源的详细过程

Python实现爬取知乎神回复简单爬虫代码分享

Python 爬取陈都灵百度图片