vbs 解析html文档的方法(htmlfile)
程序员文章站
2022-03-21 16:35:07
关于vbs采集,网上流行比较多的方法都是正则,其实 htmlfile 可以解析 html 代码,但如果 designmode 没开启的话,有时候会包安全提示信息。
但是开...
关于vbs采集,网上流行比较多的方法都是正则,其实 htmlfile 可以解析 html 代码,但如果 designmode 没开启的话,有时候会包安全提示信息。
但是开启 designmode (@预言家晚报 分享的方法) 的话,所有js都不会被执行,只是干干净净的dom文档,所以在逼不得已的情况下开启 designmode 一般情况保持默认即可。
set html = createobject("htmlfile") set http = createobject("msxml2.serverxmlhttp") html.designmode = "on" ' 开启编辑模式 http.open "get", "http://www.cnblogs.com/", false http.send strhtml = http.responsetext html.write strhtml ' 写入数据 set post_list = html.getelementbyid("post_list") for each el in post_list.children wscript.echo el.getelementsbytagname("a")(0).innertext next
其实方法很简单,但是重点是会vbs的,却不一定都会 dom 操作,所以这个很纠结。
我也没办法,只能靠你们自己了,我只是分享一下思路而已、
这样解析 html 比正则方便快捷多了。