xpath+bs4简单总结
程序员文章站
2022-05-02 17:36:58
...
xpath
1 pip install lxml
2 更多工具--扩展程序--直接拖--不可以就打包,在解包
page_tree = etree.HTML(page)
ret = page_tree.xpath("/html/body/ol/li[1]")
/text() # 内容
/@href # href属性
/li[@class='tanshui taohua'] # 属性定位一定要全
bs4
1 pip install bs4
soup = BeautifulSoup(fp, 'lxml')
li.get_text() # 内容
a.get("href") # href属性
soup.select(".heihei > haha > a") # css选择器 子选择器
soup.select("[name='ok']")