搜狗微信抓取(一)如何优雅的提取文章正文
程序员文章站
2022-06-15 12:30:45
微信搜索“菜鸟童靴”,选择“关注公众号”我们一起开启Python进阶之旅!看到网上,有人说搜狗微信的文章的正文,用xpath不好提取,正好最近做这个搜狗微信搞了一下后面继续会写,时间不定,(1)如何搜索通过搜索微信公众号,获取最新发表文章(2)搜狗微信如何获取文章的真实链接,(3)如何临时链接转永久链接问题一:为什么明明原网页能看到正文内容,xpath抓不到呢class="rich_media_content " 分析发现正文就在这div下,细心你的会发现....
微信搜索“菜鸟童靴”,选择“关注公众号”
我们一起开启Python进阶之旅!
看到网上,有人说搜狗微信的文章的正文,用xpath不好提取,正好最近做这个搜狗微信搞了一下
后面继续会写,时间不定,
(1)如何搜索通过搜索微信公众号,获取最新发表文章
(2)搜狗微信如何获取文章的真实链接,
(3)如何临时链接转永久链接
正式进入今天的文章内容:
html标签在线测试工具:
https://c.runoob.com/front-end/61
处理完正文,得到的结果显示:
本文地址:https://blog.csdn.net/BigBoy_Coder/article/details/107248863
上一篇: 一定要让你搞懂Java位运算符