欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

PHP采集网页信息

程序员文章站 2022-05-26 22:12:09
...
【求助】PHP采集网页信息
需要采集
http://bbs.zhanzhang.baidu.com/home.php?mod=space&uid=*
不同UID的用户名
不熟悉PHP以及正则,只是单纯的想要结果,所以麻烦直接给出PHP代码和前1000个UID的用户名,谢谢。
php
------解决方案--------------------
$html = file_get_contents('http://bbs.zhanzhang.baidu.com/home.php?mod=space&uid=1');
preg_match('@

(.*?)@',$html,$match);
//var_dump($match);
echo strip_tags($match[0]);


理论上uid是自增的,前1000个就是1-1000,数字自己换吧。
------解决方案--------------------
$url = 'http://bbs.zhanzhang.baidu.com/home.php?mod=space&uid=';

$res = array();
$uid = 1;
while(count($res) if(preg_match('//s', file_get_contents($url.$uid), $r)){
if(preg_match_all('/\w+/', strip_tags($r[0]), $r) == 3) {
$res[$r[0][2]] = $r[0][0];
}
}
$uid++;
}
print_r($res);
结果:(关联键为UID,值为用户名)

Array
(
[1] => sitemapbbs
[7] => _
[8] => sitemapTest2
[9] => sitemapTest
[10] => sitemapTest32
[13] => sitemapTest3
[14] => kkksuper
[16] => 05
[17] => caoli456
[18] => wangbin_ivan
[19] => geiwosou
[20] => sitemap_test1
[21] => sitemap_test5
[22] => _
[23] => lkmmmmj
[24] => blackfox1983
[25] => dongbei_wb
[26] => xyzlinger
[27] => sanwushuosi
[28] => 007
)

------解决方案--------------------
同上,不过file_get_contents方法有时候会太慢,可以采用curl.
PHP采集网页信息

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。

相关文章

相关视频


网友评论

文明上网理性发言,请遵守 新闻评论服务协议

我要评论
  • PHP采集网页信息
  • 专题推荐