欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Python爬取新闻标题

程序员文章站 2022-05-02 22:02:17
...

第一段代码:

import requests   #页面请求
from bs4 import BeautifulSoup  #转换为BeautifulSoup可读取形式
res=requests.get("http://news.sina.com.cn/china/")   #读取文件所在页面
res.encoding="utf-8"  #字符乱码格式规定
soup=BeautifulSoup(res.text,'html.parser')  #读取BeautifulSoup文字
#print(soup.text)

第二段代码:

for news in soup.select(".right-content"):  #查询文件所在区域的class类型为right-content
    #print(news)
    #print (news.select("a"))
    new_as=news.select("a")  #文件具体在a标签中
    i=1
    for news_a in new_as:
        print ('第%d条新闻标题:'%i,news_a.text)
        i=i+1
相关标签: python