网页爬虫内容正则匹配记录。
程序员文章站
2022-07-13 12:35:26
...
如图html.text=
name=re.findall(r'font-size:20px;\">([\s\S]*?)<div id=\"result\">',html.text)
print(name)
结果:
name2=re.findall(r'\n(\s*)(.*?)(\s*)</div>',name[0])
print(name2)
print(name2[0][1])
结果: