php curl抓取不到页面及来路问题？

程序员文章站 2024-02-15 12:14:04

...

$url = "http://mp.weixinbridge.com/mp/wapredirect?url=http%3A%2F%2Fwww.zhihu.com%2F";
$ch = curl_init();
$timeout = 1;
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_HEADER, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
$contents = curl_exec($ch);
curl_close($ch);
echo $contents;
相对路径的图片不能显示，如何使相对路径的图片正常显示？

回复内容：

谢邀，哥们，抓不到数据是因为：
1.你没有写header
2.没有写cookie,
3.没有针对https的url特殊设置
所以没有抓到数据，好好研究我写的这个代码，这个是可以抓到数据的。
要是帮到了你，给哥点个赞，支持下。

\n\r";
    } else {
		echo $html;
	}

我在暑假的时候爬过知乎，而且就是用的php+curl。知乎是有反爬虫机制的，你要尽量伪装成浏览器，包括header、useragent、cookie等等都设成浏览器上的一样，至于这些在哪可以看到请善用chrome的F12控制台。光伪装成浏览器是不够的，因为知乎有的页面是gzip加密的哦，所以你还要做好gzip解密的措施。如果知乎觉得你的行为可疑，知乎还会不定频率的给你返回空白页面，所以你还要做好数据验证的措施。总的来说爬知乎是不难的，但要稳定可靠的一口气爬完整个知乎还是很困难的。 curl配置增加cookie信息和header头部试试看，有些网站防采集需要尽可能的模拟。

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn核实处理。

php curl抓取不到页面及来路问题？

回复内容：

php curl抓取不到页面及来路问题？

PHP中使用CURL伪造来路抓取页面或文件

PHP中使用CURL伪造来路抓取页面或文件_PHP教程

PHP中使用CURL伪造来路抓取页面或文件

php curl抓取网页的介绍和推广及使用CURL抓取淘宝页面集成方法

PHP中使用CURL伪造来路抓取页面或文件

php curl抓取网页的介绍和推广及使用CURL抓取淘宝页面集成方法

这个有关问题有点难，curl抓取不到页面

php curl抓取网页的介绍和推广及使用CURL抓取淘宝页面集成方法_PHP

PHP中使用CURL伪造来路抓取页面或文件_PHP教程