PHP 使用curl抓取启用了viewstate的网站问题
程序员文章站
2022-06-11 08:02:07
...
请问此类网站抓取内容时,和没开启viewstate有何区别?
现在是不清楚抓取开启viewstate的网站的正确步骤,请大神指导
现在是不清楚抓取开启viewstate的网站的正确步骤,请大神指导
回复内容:
请问此类网站抓取内容时,和没开启viewstate有何区别?
现在是不清楚抓取开启viewstate的网站的正确步骤,请大神指导
正好做过这个,我来说说我的解决办法。
首先,你需要明白你要做什么,告诉服务器你的身份,许多ASP.NET都会有_viewstate这个超长的字符串。它在服务器端会进行验证.那么,你在构造request的时候,必须获得这个viewstate。其实很简单:
1 首先请求url,保存cookie,此时你能拿到这个page的data,用正则匹配到hidden的viewstate保存。
2 携带cookie请求验证码(如果有),拿到后解析验证码(人工或者机器识别)
3 携带cookie和登陆凭据模拟登陆
记住一点,viewstate是对同一个cookie有效的,也就是说,你如果在网页打开,copy下来那个字符串的,它将仍旧无法工作,除非你连同cookie都copy下来。
需要注意的是,有些参数是js自动生成的,譬如我遇到的,讲验证码用某个js加密后,作为一个hidden,你在普通的抓取回来的page里面,无法看到,这时候,你得自己实现这个加密过程。保证在同一个cookie的环境下,把服务器需要的所有数据全部提供就可以成功!
上一篇: 提高php编程效率技巧
下一篇: C#给Excel添加水印实例详解