【学习笔记】python之BeautifulSoup(持续更新)
程序员文章站
2022-07-02 18:51:54
...
from bs4 import BeautifulSoup
import requests
html = requests.get(url=url)
#格式化处理返回soup对象
soup = BeautifulSoup(html.text,'lxml')
#查找div标签,返回一个标签list
Tags = soup.find_all('div')
具体Tag的属性可以自行百度。
这里说俩:Tag.string(bs4.element.NavigableString类型)和Tag.text(str类型)
前者返回的字符串包括了子标签的内容,而后者仅返回当前标签的内容。
推荐阅读
-
Python学习笔记之os模块使用总结
-
Python学习笔记之pandas索引列、过滤、分组、求和功能示例
-
Python学习笔记之抓取某只基金历史净值数据实战案例
-
Python学习笔记之读取文件、OS模块、异常处理、with as语法示例
-
Python学习笔记之自定义函数用法详解
-
python学习笔记之调用eval函数出现invalid syntax错误问题
-
Python3.4学习笔记之 idle 清屏扩展插件用法分析
-
Python3.4学习笔记之常用操作符,条件分支和循环用法示例
-
Python学习笔记之pandas索引列、过滤、分组、求和功能示例
-
Python学习笔记之抓取某只基金历史净值数据实战案例