欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

高分!PHP网页抓取的有关问题

程序员文章站 2024-01-18 18:01:04
...
高分!PHP网页抓取的问题
http://www.zootoo.com/petnews/canineheroesamemorialdaysalute-1612
http://www.zootoo.com/petnews/hailtothecatsasalutetofirstfel-1611
http://www.zootoo.com/petnews/mothersdaygiftsforthepetloving-1592
比如这三个网页
第一个是分页内容,不用管分页
需要把正文部分抓取出来,如何处理?
PHP不是很熟,高分求教,谢谢

------解决方案--------------------
留下邮箱,我给你发个例子
------解决方案--------------------
PHP code
header("Content-type:text/html;charset=utf-8");$url="http://www.zootoo.com/petnews/hailtothecatsasalutetofirstfel-1611";  $contents=file_get_contents($url);$contents=preg_replace('/>(\s+)/','>',$contents);$contents=str_replace("\r\n",'',$contents);$contents=str_replace("\t",'',$contents);//echo $contents;preg_match_all('~
(.*?)
(.*?)