Python反爬实战掌握酷狗音乐排行榜加密规则

程序员文章站 2022-06-16 12:36:31

目录效果展示爬取目标网址：工具使用开发工具：pycharm开发环境：python3.7， windows10使用工具包：requests，re项目思路解析找到需要解析的榜单数据随意点击一个歌曲获取到音...

效果展示

爬取目标

网址：

Python反爬实战掌握酷狗音乐排行榜加密规则

工具使用

开发工具：pycharm

开发环境：python3.7， windows10

使用工具包：requests，re

项目思路解析

找到需要解析的榜单数据

Python反爬实战掌握酷狗音乐排行榜加密规则

随意点击一个歌曲获取到音乐的详情数据通过抓包的方式获取到音乐播放数据

Python反爬实战掌握酷狗音乐排行榜加密规则

找到mp3的数据提交地址 mp3数据来自于这个url地址

Python反爬实战掌握酷狗音乐排行榜加密规则

提交数据的网址：

https://wwwapi.kugou.com/yy/index.php?r=play/getdata&callback=jquery19102816534571347611_1626783818555&hash=a38449e76c74d45825f565c1fdb825c0&dfid=3dksth1sjdra44o6vj0ziryf&mid=4458f6d567640b39de367a394d69879e&platid=4&album_id=40437970&_=1626783818556

将多个网址数据进行对比看看哪些参数是需要自行修改的

Python反爬实战掌握酷狗音乐排行榜加密规则

变化的url数据有3个

hash
album_id
_

_ 可以明显看出来是时间戳需要获取到对应的hash以及album_id的值来到主页找寻对应的歌曲id数据发现数据来自网页源代码

Python反爬实战掌握酷狗音乐排行榜加密规则

歌曲的数据都是来自网页源代码

Python反爬实战掌握酷狗音乐排行榜加密规则

梳理整体思路：

从首页源码里提取出对应的hash、album_id值
组合成新的url地址
获取到json数据总的歌曲播放地址

简易源码分享

本章内容只限学习，切勿用作其他用途！！！！！

import requests
import re
import time
def tools(url):
    headers = {
        'user-agent': 'mozilla/5.0 (windows nt 10.0; win64; x64) applewebkit/537.36 (khtml, like gecko) chrome/91.0.4472.124 safari/537.36 edg/91.0.864.70'
    }
    response = requests.get(url, headers=headers)
    return response
def save(name, url):
    mp3 = tools(url).content  # 请求mp3地址链接 返回格式是16进制
    f = open('./kugou/{}.mp3'.format(name), 'wb') # w 文件存在就写入  不存在就会创建  b进制读写
    f.write(mp3)
    f.close()
    print('{}下载完成....'.format(name))
url = 'https://www.kugou.com/yy/html/rank.html'
response = tools(url).text
album_id = re.findall(r'"album_id":(\d*?),', response) # id
hash = re.findall(r'"hash":"(.*?)",', response)  # hash
for a, h in zip(album_id, hash):
    # 生成时间戳
    time1 = int(time.time() * 1000)
    # 包含歌曲下载地址的url
    urls = 'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&hash={}&dfid=0zlwqk0uwnfa0weunx0hjlfa&mid=f79511e2e86914b99e351c42ba1f8bc7&platid=4&album_id={}&_={}'.format(h, a, time1)
    response1 = tools(urls).json()
    audio_name = response1['data']['audio_name'].split('-')[1]
    play_url = response1['data']['play_url']
    save(audio_name, play_url)

以上就是python实战酷狗音乐反爬排行榜加密规则的详细内容，更多关于python反爬酷狗音乐排行榜加密规则的资料请关注其它相关文章！

相关标签： Python 反爬酷狗排行榜

上一篇： Kotlin 协程 + Spring webflux 开发后端

下一篇：无语！iOS 11相机二维码存在大漏洞苹果竟无视

Python反爬实战掌握酷狗音乐排行榜加密规则

目录

效果展示

爬取目标

工具使用

项目思路解析

简易源码分享

Python反爬实战掌握酷狗音乐排行榜加密规则

Python爬虫实战项目掌握酷狗音乐的加密过程

Python反爬实战掌握酷狗音乐排行榜加密规则