scrapy爬取网易云音乐

程序员文章站 2022-05-08 10:57:09

...

具体的代码放到了github上面：Nereus-Minos

一、分析：

1、一般网易云音乐歌曲的链接地址是形式：http://music.163.com/song/media/outer/url?id=1203045.mp3

(其中需要修改的只是id部分，所以主要工作是获得歌曲的id)

二、注意：(https://music.163.com/#/discover/toplist?id=19723756)

1、网址中间不能加“#”，要自己去除其中的“#”，去除“#”，去除“#”，去除“#”！！！

2、在爬取的时候现将返回来的response.url，和response.body看一看，可能返回的html和我们在网页上看到的html不一样

3、can only concatenate list (not "float") to list是因为非列表元素与列表元素连接了，容易错在file_path方法中

4、重定向（302错误）：在settings文件中

MEDIA_ALLOW_REDIRECTS = True

在pipelines文件中

def handle_redirect(self, file_url):
    response = requests.head(file_url)
    if response.status_code == 302:
        file_url = response.headers["Location"]
    return file_url

def get_media_requests(self, item, info):
    redirect_url = self.handle_redirect(item["file_urls"][0])
    yield scrapy.Request(redirect_url)

scrapy爬取网易云音乐

具体的代码放到了github上面：Nereus-Minos

一、分析：

二、注意：(https://music.163.com/#/discover/toplist?id=19723756)

1、网址中间不能加“#”，要自己去除其中的“#”，去除“#”，去除“#”，去除“#”！！！

2、在爬取的时候现将返回来的response.url，和response.body看一看，可能返回的html和我们在网页上看到的html不一样

3、can only concatenate list (not "float") to list是因为非列表元素与列表元素连接了，容易错在file_path方法中

4、重定向（302错误）：在settings文件中

在pipelines文件中

爬虫scrapy框架爬取一药网

12大联合会员129元大促：QQ音乐/网易云音乐/酷狗/芒果等

java+selenium 网易云音乐刷累计听歌数的方法

使用scrapy框架爬取桌面背景图片

使用Python的Scrapy框架十分钟爬取美女图

使用Python实现下载网易云音乐的高清MV

vue模仿网易云音乐的单页面应用

Python批量处理网易云音乐缓存文件获取MP3

网易云音乐怎么匹配聊天

Android控件RecyclerView实现混排效果仿网易云音乐

scrapy爬取网易云音乐

具体的代码放到了github上面：Nereus-Minos

一、分析：

二、注意：(https://music.163.com/#/discover/toplist?id=19723756)

1、网址中间不能加“#”，要自己去除其中的“#”，去除“#”，去除“#”，去除“#”！！！

2、在爬取的时候现将返回来的response.url，和response.body看一看，可能返回的html和我们在网页上看到的html不一样

3、can only concatenate list (not "float") to list是因为非列表元素与列表元素连接了，容易错在file_path方法中

4、重定向（302错误）：在settings文件中

在pipelines文件中

爬虫scrapy框架 爬取一药网

12大联合会员129元大促：QQ音乐/网易云音乐/酷狗/芒果等

java+selenium 网易云音乐刷累计听歌数的方法

使用scrapy框架爬取桌面背景图片

使用Python的Scrapy框架十分钟爬取美女图

使用Python实现下载网易云音乐的高清MV

vue模仿网易云音乐的单页面应用

Python批量处理网易云音乐缓存文件获取MP3

网易云音乐怎么匹配聊天

Android控件RecyclerView实现混排效果仿网易云音乐

爬虫scrapy框架爬取一药网