欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

curl采集

程序员文章站 2022-06-11 10:29:51
...
curl采集,求助
采集$url="http://s.click.taobao.com/t_8?e=7HZ6jHSTbIWZXoQ43%2BGOC2vGvlT28S6knArdy2HkZM%2BsVw%3D%3D&p=mm_32165125_0_0";
淘宝会自动跳转$url地址:http://item.taobao.com/item.htm?id=15711538808&ali_trackid=2:mm_32165125_0_0:1346999816_310_551572511

怎样才能获取到跳转后的$url,请帖详细代码
请用我给的url测试,谢谢

------解决方案--------------------
真的很佩服楼主的执着!
观察了一下,个人认为很难,不过按楼主的执着,实现还是之日可待的

对于 $url 直接抓取后去的跳转地址

HTTP/1.1 302 Moved Temporarily
Server: Tengine
Date: Sun, 09 Sep 2012 13:16:39 GMT
Content-Type: text/html
Connection: close
Location: http://s.click.taobao.com/t_js?tu=http%3A%2F%2Fs.click.taobao.com%2Ft_8%3Fe%3D7HZ6jHSTbIWZXoQ43%252BGOC2vGvlT28S6knArdy2HkZM%252BsVw%253D%253D%26p%3Dmm_32165125_0_0%26ref%3D

Expires: Sun, 09 Sep 2012 13:16:39 GMT
Cache-Control: max-age=0

这个http://s.click.taobao.com/t_js是一个js文件,里面有
var inf = (top.location!=self.location); //不在框架中时为真
其后有
if(inf){
var oi = document.createElement("iframe");
创建一个插入式框架,该框架里引入了 http://js.tongji.linezing.com/1023331/tongji.js
对url参数进行编解码后设置cookie,然后跳转到 tu 执行的地址

由于 curl 不能执行 js,所以你需要用php去模拟这一过程的实现
curl采集

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。

相关文章

相关视频