php跟踪蜘蛛程序
很早就想找一份搜索引擎跟踪的代码,一直没找到,今天偶然找到一个分享给大家:
<?php
function get_naps_bot()
{
$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
if (strpos($useragent, 'googlebot') !== false){
return 'Googlebot';
}
if (strpos($useragent, 'msnbot') !== false){
return 'MSNbot';
}
if (strpos($useragent, 'slurp') !== false){
return 'Yahoobot';
}
if (strpos($useragent, 'baiduspider') !== false){
return 'Baiduspider';
}
if (strpos($useragent, 'sohu-search') !== false){
return 'Sohubot';
}
if (strpos($useragent, 'lycos') !== false){
return 'Lycos';
}
if (strpos($useragent, 'robozilla') !== false){
return 'Robozilla';
}
return false;
}
function nowtime(){
$date=date("Y-m-d.G:i:s");
return $date;
}
$searchbot = get_naps_bot();
if ($searchbot) {
$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
$url=$_SERVER['HTTP_REFERER'];
$file="robotlog.txt";
$time=nowtime();
$data=fopen($file,"a");
$PR="$_SERVER[REQUEST_URI]";
fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispagen page:$PRrn");
fclose($data);
}
?>
其中$file=”robotlog.txt”;中间的文件名可以修改,robotlog.txt代表蜘蛛爬行日志在这个记事本内。这就是蜘蛛程序的源文件,下面是下载地址,用的zip压缩包压缩了的,里面有个robots.php文件放到主题模板目录就可以了:
http://www.tianchuangseo.com/wp-content/uploads/2010/09/robots.zip
放进去了过后还要对一个文件代码进行修改才行,由于我是WordPress的博客程序,我修改的文件就是footer.php(底部)由于加载这个会对页面大小有影响,所以加载在尾部可以让影响降到最低。
您还未登录,需要登录后才能发言