php跟踪蜘蛛程序

很早就想找一份搜索引擎跟踪的代码,一直没找到,今天偶然找到一个分享给大家:

<?php

function get_naps_bot()
{
$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);

if (strpos($useragent, 'googlebot') !== false){
return 'Googlebot';
}

if (strpos($useragent, 'msnbot') !== false){
return 'MSNbot';
}

if (strpos($useragent, 'slurp') !== false){
return 'Yahoobot';
}

if (strpos($useragent, 'baiduspider') !== false){
return 'Baiduspider';
}

if (strpos($useragent, 'sohu-search') !== false){
return 'Sohubot';
}

if (strpos($useragent, 'lycos') !== false){
return 'Lycos';
}

if (strpos($useragent, 'robozilla') !== false){
return 'Robozilla';
}

return false;
}
function nowtime(){
$date=date("Y-m-d.G:i:s");

return $date;
}

$searchbot = get_naps_bot();

if ($searchbot) {
$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
$url=$_SERVER['HTTP_REFERER'];
$file="robotlog.txt";
$time=nowtime();
$data=fopen($file,"a");
$PR="$_SERVER[REQUEST_URI]";
fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispagen page:$PRrn");
fclose($data);
}
?>

其中$file=”robotlog.txt”;中间的文件名可以修改,robotlog.txt代表蜘蛛爬行日志在这个记事本内。这就是蜘蛛程序的源文件,下面是下载地址,用的zip压缩包压缩了的,里面有个robots.php文件放到主题模板目录就可以了:

http://www.tianchuangseo.com/wp-content/uploads/2010/09/robots.zip

放进去了过后还要对一个文件代码进行修改才行,由于我是WordPress的博客程序,我修改的文件就是footer.php(底部)由于加载这个会对页面大小有影响,所以加载在尾部可以让影响降到最低。

本文固定链接: http://www.webzhishi.com/php_genzhong/ | web知识网

【上一篇】
【下一篇】

php跟踪蜘蛛程序:等您坐沙发呢!

发表评论

快捷键:Ctrl+Enter