教你用Python爬取哔哩哔哩全站视频信息

程序员文章站 2024-03-25 17:50:58

...

哔哩哔哩全站视频信息爬虫(可能会漏爬)

B 站感觉最近几年发展得太快了,不由得想知道有多少视频,翻阅了一大半网络找了很多爬虫感觉都不是特别的复合自己的胃口(挑食~),于是自己写一个(才学习爬虫没多久写得垃圾代码大佬别喷我啊….)

开发环境: Windows10 + Python3

工具: VSCode

准备工作

安装

Python3

安装Python这些就麻烦自己百度吧..

依赖

pip3 install -r requirements.txt

运行

python3 bili_video_get.py

代码部分

教你用Python爬取哔哩哔哩全站视频信息

运行结果截图(出现各种403,或访问权限不足请不要在意)

教你用Python爬取哔哩哔哩全站视频信息

保存本地结果

教你用Python爬取哔哩哔哩全站视频信息

思路

通过浏览器打开网页url,打开开发者工具(F12),点击Network,点击JS,刷新(F5),找到 api地址

这里写图片描述

复制下来，去除没必要的内容，得到 https://api.bilibili.com/x/web-interface/archive/stat?aid=15906633 ，用浏览器打开，会得到如下的 json 数据

{ "code":0, "message":"0", "ttl":1, "data":{ "aid":15666899, "view":4422, "danmaku":2, "reply":12, "favorite":28, "coin":4, "share":48, "like":1, "now_rank":0, "his_rank":0, "no_reprint":0, "copyright":2 } }

所以通过访问 api,得到数据,解析,然后保存到数据库或者保存到本地……我差不多爬了半天左右,出去吃个饭回来看了看,逛了一个某乎,然后电脑就蓝屏了…..数据就没爬完,打算放Linux下爬,由于这个脚本只在Windows10上测试过,在其他环境测试请自己动手改一下保存本地地址……

教你用Python爬取哔哩哔哩全站视频信息

Github项目地址: 点击此处

免责申明

本爬虫只用于个人学习,切勿用于其他用途,否则出现一切问题作者概不负责.

如有对贵公司造成损失请联系我进行删除

相关标签： Python 哔哩哔哩爬虫

上一篇： axis测试https开头的webservice webservicejavaaxis

下一篇：【转】GoF的23个经典设计模式博客分类： JAVA拾遗 GoF的23个经典设计模式

教你用Python爬取哔哩哔哩全站视频信息

哔哩哔哩全站视频信息爬虫(可能会漏爬)

安装

Python3

依赖

运行

代码部分

运行结果截图(出现各种403,或访问权限不足请不要在意)

保存本地结果

思路

免责申明

本爬虫只用于个人学习,切勿用于其他用途,否则出现一切问题作者概不负责.

教你用Python爬取哔哩哔哩全站视频信息

Python爬取哔哩哔哩（bilibili）视频

Python爬虫爬取哔哩哔哩视频下载

python 爬取哔哩哔哩up主信息和投稿视频

哔哩哔哩视频信息爬虫（实时爬取）

Python爬取哔哩哔哩视频的相关信息后续

爬取华农兄弟哔哩哔哩所有视频信息

Python爬虫爬取哔哩哔哩视频下载

介绍Python爬取哔哩哔哩视频

python 爬取哔哩哔哩up主信息和投稿视频