python爬视频实例

程序员文章站 2022-05-03 22:00:32

例：抓取PhotoShop视频教程网址http://www.mxiaobei.com/?id=424 BeautifulSoup: https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/ Requests: http://cn.python reque ......

例：抓取photoshop视频教程网址http://www.mxiaobei.com/?id=424

import requests
import re
from bs4 import beautifulsoup
import time

dicts = {}
list1 = set()

print('start')

ua = 'mozilla/5.0 (macintosh; intel mac os x 10_14_0) applewebkit/537.36 (khtml, like gecko) chrome/76.0.3809.87 safari/537.36'

urls = 'http://www.mxiaobei.com/?id='

for index in range(451, 565):
    r = requests.get(urls + str(index), headers = {'user-agent': ua })
    r.encoding = 'utf-8'
    soup = beautifulsoup(r.text, 'lxml')
    title = soup.find(name='h2')
    mp4url = soup.find('div', id='cuplayer')
    if mp4url is none:
        list1.add(index)
        continue
    mpurl = re.search('http.*?mp4', mp4url.text)
    dicts[title.text] = mpurl.group()
    #print(index)
    #time.sleep(1)
    #print(title.text + ' : ' + dicts[title.text])
print(dicts)
print(list1)
for temp in dicts.items():
    #time.sleep(1)
    r = requests.get(temp[1], stream=true)
    with open(temp[0] + '.mp4', "wb") as mp4:
        for chunk in r.iter_content(chunk_size=1024 * 1024):
            if chunk:
                mp4.write(chunk)
    print(temp[0]+'下载完成')
print('end!')

beautifulsoup: https://beautifulsoup.readthedocs.io/zh_cn/v4.4.0/
requests: http://cn.python-requests.org/zh_cn/latest/

上一篇： MySQL下的DB Link

下一篇： 8/4 网易互娱模拟笔试

python爬视频实例

python类方法和实例方法的区别

python 队列详解及实例代码

iOS 本地视频和网络视频流播放实例代码

详解python3百度指数抓取实例

利用Python破解验证码实例详解

shelve 用来持久化任意的Python对象实例代码

python连接mysql实例分享

Python 爬虫多线程详解及实例代码

Python应用03 使用PyQT制作视频播放器实例

python 根据正则表达式提取指定的内容实例详解