欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

php记录搜索引擎爬行记录的实现代码

程序员文章站 2022-11-18 09:27:15
下面是完整代码: //记录搜索引擎爬行记录 $searchbot = get_naps_bot(); if ($searchbot) { $tlc_thi...

下面是完整代码:

//记录搜索引擎爬行记录 $searchbot = get_naps_bot(); 
if ($searchbot) 
{ $tlc_thispage = addslashes($_server['http_user_agent']); 
$url = $_server['http_referer']; 
$file = web_path.'robotslogs.txt'; 
$date = date('y-m-d h:i:s'); 
$data = fopen($file,'a'); 
fwrite($data,"time:$date robot:$searchbot url:$tlc_thispage/r/n"); 
fclose($data);
}

web_path为index.php下define的根目录路径,意思就是说robotslogs.txt文件是放在根目录下的。

通过get_naps_bot()获取蜘蛛爬行记录,然后在通过addslashes处理一下,将数据存储于变量$tlc_thispage中。

fopen打开robotslogs.txt文件,将数据通过函数fwrite写入,在通过函数fclose关闭就可以了。

因为我觉得没必要,所以把自己网站上的代码删除了,所以也没有效果示例了。

ps:php获取各搜索蜘蛛爬行记录的代码

支持如下的搜索引擎:baidu,google,bing,yahoo,soso,sogou,yodao爬行网站的记录!

代码:

<?php 
/**
* 获取搜索引擎爬行记录
* edit by www.jb51.net
*/
function get_naps_bot() 
{ 
$useragent = strtolower($_server['http_user_agent']); 
if (strpos($useragent, 'googlebot') !== false){ 
return 'google'; 
} 
if (strpos($useragent, 'baiduspider') !== false){ 
return 'baidu'; 
} 
if (strpos($useragent, 'msnbot') !== false){ 
return 'bing'; 
} 
if (strpos($useragent, 'slurp') !== false){ 
return 'yahoo'; 
} 
if (strpos($useragent, 'sosospider') !== false){ 
return 'soso'; 
} 
if (strpos($useragent, 'sogou spider') !== false){ 
return 'sogou'; 
} 
if (strpos($useragent, 'yodaobot') !== false){ 
return 'yodao'; 
} 
return false; 
} 
function nowtime(){ 
$date=date("y-m-d.g:i:s"); 
return $date; 
} 
$searchbot = get_naps_bot(); 
if ($searchbot) { 
$tlc_thispage = addslashes($_server['http_user_agent']); 
$url=$_server['http_referer']; 
$file="www.jb51.net.txt"; 
$time=nowtime(); 
$data=fopen($file,"a"); 
fwrite($data,"time:$time robot:$searchbot url:$tlc_thispage\n"); 
fclose($data); 
} 
?>

总结

以上所述是小编给大家介绍的php记录搜索引擎爬行记录,希望对大家有所帮助