爬虫实战 - 如何爬取B站视频评论？

程序员文章站 2022-06-27 23:29:20

步骤（本次爬虫仅以一个视频为示例：链接）查找评论请求api解析URL去掉第一个和最后一个参数可得评论URL，即：https://api.bilibili.com/x/v2/reply?jsonp=jsonp&pn=1&type=1&oid=585286365&sort=2【其中pn是页码；sort控制排序顺序，1按时间排序，2按热度排序；oid代码视频编号】- 开始敲代码import requestsheader = {"User-Agent": "M...

步骤

（本次爬虫仅以一个视频为示例：链接）

查找评论请求api
解析URL
去掉第一个和最后一个参数可得评论URL，即：https://api.bilibili.com/x/v2/reply?jsonp=jsonp&pn=1&type=1&oid=585286365&sort=2
【其中pn是页码；sort控制排序顺序，1按时间排序，2按热度排序；oid代码视频编号】
- 开始敲代码

import requests

header = {"User-Agent": "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:22.0) Gecko/20100101 Firefox/22.0",
		  "Cookie": ""}
comments = []
original_url = "https://api.bilibili.com/x/v2/reply?jsonp=jsonp&type=1&oid=585286365&sort=2&pn="

for page in range(1, 39):   # 页码这里就简单处理了
    url = original_url + str(page)
    print(url)
    try:
        html = requests.get(url, headers=header)
        data = html.json()
        if data['data']['replies']:
            for i in data['data']['replies']:
                comments.append(i['content']['message'])
    except Exception as err:
        print(url)
        print(err)

本文地址：https://blog.csdn.net/Totoro1745/article/details/109908334

爬虫实战 - 如何爬取B站视频评论？

步骤

Python爬虫实例：爬取B站《工作细胞》短评——异步加载信息的爬取

爬虫实战系列(二)：利用Selenium自动获取B站建国同志视频信息

Python 自动爬取B站视频

python爬虫实战爬取B站柯南弹幕+梳理主线剧情

python3写爬取B站视频弹幕功能

Python爬虫实战之爬取美剧网站全部视频

Python如何爬取b站热门视频并导入Excel

Python爬取B站不讲武德、耗子尾汁出处的视频弹幕

Python爬取b站任意up主所有视频弹幕

爬虫实战 - 如何爬取B站视频评论？

爬虫实战 - 如何爬取B站视频评论？

步骤

Python爬虫实例：爬取B站《工作细胞》短评——异步加载信息的爬取

爬虫实战系列(二)：利用Selenium自动获取B站建国同志视频信息

Python 自动爬取B站视频

python爬虫实战 爬取B站柯南弹幕+梳理主线剧情

python3写爬取B站视频弹幕功能

Python爬虫实战之爬取美剧网站全部视频

Python如何爬取b站热门视频并导入Excel

Python爬取B站不讲武德、耗子尾汁出处的视频弹幕

Python爬取b站任意up主所有视频弹幕

爬虫实战 - 如何爬取B站视频评论？

python爬虫实战爬取B站柯南弹幕+梳理主线剧情