欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

如何利用python爬虫爬取爱奇艺VIP电影?

程序员文章站 2022-06-10 17:18:04
环境:windows python3.7 思路: 1、先选取你要爬取的电影 2、用vip解析工具解析,获取地址 3、写好脚本,下载片断 4、将片断利用电脑合成 需要的python模块: ##第一个模块不要安装,第二个模块需要安装 1、from multiprocessing import Pool ......

环境:windows    python3.7

思路:

1、先选取你要爬取的电影

2、用vip解析工具解析,获取地址

3、写好脚本,下载片断

4、将片断利用电脑合成

需要的python模块:

##第一个模块不要安装,第二个模块需要安装

1、from multiprocessing import pool

2、import requests

##模块安装方法

用windows命令行终端

pip install requests

 

一、先选取你要爬的电影,本例随便找了个vip电影,复制地址

如何利用python爬虫爬取爱奇艺VIP电影?

 

二、用vip解析工具解析,获取地址

 (一)进行上网搜索,点击vip解析

 

如何利用python爬虫爬取爱奇艺VIP电影?

 

 

(二)、粘贴电影地址,点击播放

 

如何利用python爬虫爬取爱奇艺VIP电影?

 

(三)、按下f12或者右击点检查,进入开发者工具界面,点击网络,复制地址

 

如何利用python爬虫爬取爱奇艺VIP电影?

 

三、写好脚本,利用爬虫下载片断

##描述:该脚本目前适合下载爱奇艺,腾迅视频vip视频
##作者:小刘
##电话:有事请写评论
##注意:只适全python爬虫的学习者,不适合专门去看电影的爱好者
##导入的两个模块,其中requests模块需要自行下载
from multiprocessing import pool
import requests
##定义一个涵数
def demo(i):
    ##定义了一个url,后面%3d就是截取后面三位给他加0,以防止i的参数是1的时候参数对不上号,所以是1的时候就变成了001
    url="https://vip.okokbo.com/20180114/arvczxqd/1000kb/hls/phj51837151%03d.ts"%i
    ##定义了请求头信息
    headers={"user-agent":"mozilla/5.0 (windows nt 10.0; wow64) applewebkit/537.36 (khtml, like gecko) chrome/49.0.2623.221 safari/537.36"}
    ##构建自定义请求对象
    req=requests.get(url,headers=headers)
    ##将文件保存在当前目录的mp4文件中,名字以url后十位数起名
    with open('./mp4/ {}'.format(url[-10:]), 'wb') as f:
        f.write(req.content)

##程序代码的入口
if __name__=='__main__':
    ##定义一个进程池,可以同时执行二十个任务,不然一个一个下载太慢
    pool = pool(20)
    ##执行任务的代码
    for i in range(100):
        pool.apply_async(demo, (i,))

    
    pool.close()
    pool.join()

 

 四、将片断利用电脑合成

(一)、复制电影存放的路径

 

如何利用python爬虫爬取爱奇艺VIP电影?

 (二)、用进入windows命令行模式,粘贴地址

 

 如何利用python爬虫爬取爱奇艺VIP电影?

 

 (三)、复制该目录下所有以*.ts结尾的文件,复制成一个文件

 

 如何利用python爬虫爬取爱奇艺VIP电影?

 

 (四)、进行合并

 

 如何利用python爬虫爬取爱奇艺VIP电影?

 

(五)、进行验证

 

如何利用python爬虫爬取爱奇艺VIP电影?

 

 

 

五、有疑问请留言