欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

【学习笔记】python之BeautifulSoup(持续更新)

程序员文章站 2022-07-02 18:51:54
...
from bs4 import BeautifulSoup
import requests
html = requests.get(url=url)
#格式化处理返回soup对象
soup = BeautifulSoup(html.text,'lxml')
#查找div标签,返回一个标签list
Tags = soup.find_all('div')

具体Tag的属性可以自行百度。
这里说俩:Tag.string(bs4.element.NavigableString类型)和Tag.text(str类型)
前者返回的字符串包括了子标签的内容,而后者仅返回当前标签的内容。