python requests 简单网页文本爬取

程序员文章站 2022-06-18 19:50:13

爬取网页：用requeusts获取整个网页的HTML信息；使用Beautiful Soup解析HTML信息 ......

爬取网页：

http://www.cnblogs.com/xrq730/archive/2018/06/11/9159586.html

抓取的是一个博客的文本内容

用requeusts获取整个网页的HTML信息；
使用Beautiful Soup解析HTML信息

python requests 简单网页文本爬取

 1 import requests
 2 from bs4 import BeautifulSoup
 3  
 4 
 5 if __name__=='__main__':
 6     target='http://www.cnblogs.com/xrq730/archive/2018/06/11/9159586.html'
 7     req=requests.get(url=target)
 8     html=req.text
 9     bf=BeautifulSoup(html)
10     texts=bf.find_all('div',class_='blogpost-body')
11     #print(html)
12     print(texts[0].text.replace('<p><span style=\"font-size: 14px; font-family: 宋体;\">','\n\n\t'))
13     #print(texts[0].text.replace('\ax0'*8,'\n\n'))

上一篇：红米k50游戏增强版是什么马达红米k50游戏增强版马达性能介绍

下一篇：小米摄像头画质怎么设置? 小米摄像头调整清晰度的技巧

python requests 简单网页文本爬取

利用python爬虫爬取斗鱼图片(简单详细)

Python实现爬取知乎神回复简单爬虫代码分享

Python网络爬虫（selenium爬取动态网页、爬虫案例分析、哈希算法与RSA加密）

python爬取网页转换为PDF文件

利用python爬虫爬取斗鱼图片(简单详细)

详解Python静态网页爬取获取高清壁纸

Python网络爬虫开发从环境搭建到实例爬取网页

python使用requests模块实现爬取电影天堂最新电影信息

python requests爬取高德地图数据的实例

python爬取网页内容转换为PDF文件