欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

xpath+bs4简单总结

程序员文章站 2022-05-02 17:36:58
...

xpath
1  pip install lxml
2  更多工具--扩展程序--直接拖--不可以就打包,在解包

page_tree = etree.HTML(page)
ret = page_tree.xpath("/html/body/ol/li[1]")

/text()  # 内容
/@href  # href属性
/li[@class='tanshui taohua']  # 属性定位一定要全

bs4
1  pip install bs4

soup = BeautifulSoup(fp, 'lxml')

li.get_text()  # 内容
a.get("href")  # href属性
soup.select(".heihei > haha > a")  # css选择器 子选择器
soup.select("[name='ok']")

相关标签: xpath bs4