Python爬取新闻标题
程序员文章站
2022-05-02 22:02:17
...
第一段代码:
import requests #页面请求
from bs4 import BeautifulSoup #转换为BeautifulSoup可读取形式
res=requests.get("http://news.sina.com.cn/china/") #读取文件所在页面
res.encoding="utf-8" #字符乱码格式规定
soup=BeautifulSoup(res.text,'html.parser') #读取BeautifulSoup文字
#print(soup.text)
第二段代码:
for news in soup.select(".right-content"): #查询文件所在区域的class类型为right-content
#print(news)
#print (news.select("a"))
new_as=news.select("a") #文件具体在a标签中
i=1
for news_a in new_as:
print ('第%d条新闻标题:'%i,news_a.text)
i=i+1
下一篇: Requests模块获取网页源代码