欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

网页爬虫内容正则匹配记录。

程序员文章站 2022-07-13 12:35:26
...

如图html.text=

网页爬虫内容正则匹配记录。

name=re.findall(r'font-size:20px;\">([\s\S]*?)<div id=\"result\">',html.text)
print(name)

结果:

网页爬虫内容正则匹配记录。

name2=re.findall(r'\n(\s*)(.*?)(\s*)</div>',name[0])
print(name2)
print(name2[0][1])

结果:

网页爬虫内容正则匹配记录。