怎么用PHP抓取网站HTML
程序员文章站
2024-02-04 11:01:22
...
连接地址
抓取上面连接的 HTML 用file_get_contents() 测试没成功 怎么回事啊?
其中curl_setopt($ch, CURLOPT_FOLLOWLOCATION,true);设置比较重要,可以用来跟随天猫的重定向页面。
http://detail.tmall.com/item.htm?spm=a230r.1.0.0.MlI5e4&id=40364502055&ad_id=&am_id=&cm_id=140105335569ed55e27b&pm_id=&abbucket=12
抓取上面连接的 HTML 用file_get_contents() 测试没成功 怎么回事啊?
回复讨论(解决方案)
file_get_contents() 成功了呀
你可以采用楼上的写法 也可以采用curl来获取,最重要的是要看你啥需求。
查一下php手册中的curl
多测试几次filegetcontents,实在不行就curl
一般就是伪造useragent和referer,也许再带个cookie
可以抓取到的 还可以根据对应的字符闭合段去进行抓取
其中curl_setopt($ch, CURLOPT_FOLLOWLOCATION,true);设置比较重要,可以用来跟随天猫的重定向页面。
非常感谢你啊
上一篇: #17 random&json模块
推荐阅读
-
怎么用PHP抓取网站HTML
-
tmal PHP将整个网站生成HTML纯静态网页的方法总结
-
node.js - 用基于FIS的Scrat前端框架, 怎么和php的后台合作呢?
-
PHP怎么解决网站大流量与高并发的有关问题
-
PHP 怎么用 simple xml 来获取 节点名称
-
使用PHP curl模拟浏览器抓取网站信息
-
怎么查看一个网站首页是index.htm还是index.php 不用试的方法.或者有哪个浏览器可以直接显示的
-
用PHP的ob_start()控制您的浏览器cache、生成html_PHP
-
PHP随机插入关键字到有HTML的内容该怎么实现
-
怎么用CSS来做无边框的表格?_html/css_WEB-ITnose