网页爬虫内容正则匹配记录。

程序员文章站 2022-07-13 12:35:26

...

如图html.text=

网页爬虫内容正则匹配记录。

name=re.findall(r'font-size:20px;\">([\s\S]*?)<div id=\"result\">',html.text)
print(name)

结果：

网页爬虫内容正则匹配记录。

name2=re.findall(r'\n(\s*)(.*?)(\s*)</div>',name[0])
print(name2)
print(name2[0][1])

结果：

网页爬虫内容正则匹配记录。

相关标签： python 爬虫 python 正则匹配

推荐阅读

零基础写python爬虫之使用urllib2组件抓取网页内容