php记录搜索引擎爬行记录的实现代码
程序员文章站
2022-04-26 11:07:30
下面是完整代码:
//记录搜索引擎爬行记录 $searchbot = get_naps_bot();
if ($searchbot)
{ $tlc_thi...
下面是完整代码:
//记录搜索引擎爬行记录 $searchbot = get_naps_bot(); if ($searchbot) { $tlc_thispage = addslashes($_server['http_user_agent']); $url = $_server['http_referer']; $file = web_path.'robotslogs.txt'; $date = date('y-m-d h:i:s'); $data = fopen($file,'a'); fwrite($data,"time:$date robot:$searchbot url:$tlc_thispage/r/n"); fclose($data); }
web_path为index.php下define的根目录路径,意思就是说robotslogs.txt文件是放在根目录下的。
通过get_naps_bot()
获取蜘蛛爬行记录,然后在通过addslashes处理一下,将数据存储于变量$tlc_thispage中。
fopen打开robotslogs.txt文件,将数据通过函数fwrite写入,在通过函数fclose关闭就可以了。
因为我觉得没必要,所以把自己网站上的代码删除了,所以也没有效果示例了。
ps:php获取各搜索蜘蛛爬行记录的代码
支持如下的搜索引擎:baidu,google,bing,yahoo,soso,sogou,yodao爬行网站的记录!
代码:
<?php /** * 获取搜索引擎爬行记录 * edit by www.jb51.net */ function get_naps_bot() { $useragent = strtolower($_server['http_user_agent']); if (strpos($useragent, 'googlebot') !== false){ return 'google'; } if (strpos($useragent, 'baiduspider') !== false){ return 'baidu'; } if (strpos($useragent, 'msnbot') !== false){ return 'bing'; } if (strpos($useragent, 'slurp') !== false){ return 'yahoo'; } if (strpos($useragent, 'sosospider') !== false){ return 'soso'; } if (strpos($useragent, 'sogou spider') !== false){ return 'sogou'; } if (strpos($useragent, 'yodaobot') !== false){ return 'yodao'; } return false; } function nowtime(){ $date=date("y-m-d.g:i:s"); return $date; } $searchbot = get_naps_bot(); if ($searchbot) { $tlc_thispage = addslashes($_server['http_user_agent']); $url=$_server['http_referer']; $file="www.jb51.net.txt"; $time=nowtime(); $data=fopen($file,"a"); fwrite($data,"time:$time robot:$searchbot url:$tlc_thispage\n"); fclose($data); } ?>
总结
以上所述是小编给大家介绍的php记录搜索引擎爬行记录,希望对大家有所帮助