欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

搜狗微信抓取(一)如何优雅的提取文章正文

程序员文章站 2022-03-10 22:45:44
微信搜索“菜鸟童靴”,选择“关注公众号”我们一起开启Python进阶之旅!看到网上,有人说搜狗微信的文章的正文,用xpath不好提取,正好最近做这个搜狗微信搞了一下后面继续会写,时间不定,(1)如何搜索通过搜索微信公众号,获取最新发表文章(2)搜狗微信如何获取文章的真实链接,(3)如何临时链接转永久链接问题一:为什么明明原网页能看到正文内容,xpath抓不到呢class="rich_media_content " 分析发现正文就在这div下,细心你的会发现....

微信搜索“菜鸟童靴”,选择“关注公众号”

我们一起开启Python进阶之旅!

 

搜狗微信抓取(一)如何优雅的提取文章正文

 

看到网上,有人说搜狗微信的文章的正文,用xpath不好提取,正好最近做这个搜狗微信搞了一下

 

后面继续会写,时间不定,

(1)如何搜索通过搜索微信公众号,获取最新发表文章

(2)搜狗微信如何获取文章的真实链接,

(3)如何临时链接转永久链接

正式进入今天的文章内容:

 

html标签在线测试工具:

https://c.runoob.com/front-end/61

处理完正文,得到的结果显示:

搜狗微信抓取(一)如何优雅的提取文章正文

本文地址:https://blog.csdn.net/BigBoy_Coder/article/details/107248863