您有个知识币

【退出】

php跟踪蜘蛛程序

很早就想找一份搜索引擎跟踪的代码,一直没找到,今天偶然找到一个分享给大家:

<?php

function get_naps_bot()

{

$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);

if (strpos($useragent, 'googlebot') !== false){

return 'Googlebot';

}

if (strpos($useragent, 'msnbot') !== false){

return 'MSNbot';

}

if (strpos($useragent, 'slurp') !== false){

return 'Yahoobot';

}

if (strpos($useragent, 'baiduspider') !== false){

return 'Baiduspider';

}

if (strpos($useragent, 'sohu-search') !== false){

return 'Sohubot';

}

if (strpos($useragent, 'lycos') !== false){

return 'Lycos';

}

if (strpos($useragent, 'robozilla') !== false){

return 'Robozilla';

}

return false;

}

function nowtime(){

$date=date("Y-m-d.G:i:s");

return $date;

}

$searchbot = get_naps_bot();

if ($searchbot) {

$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);

$url=$_SERVER['HTTP_REFERER'];

$file="robotlog.txt";

$time=nowtime();

$data=fopen($file,"a");

$PR="$_SERVER[REQUEST_URI]";

fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispagen page:$PRrn");

fclose($data);

}

?>

其中$file=”robotlog.txt”;中间的文件名可以修改,robotlog.txt代表蜘蛛爬行日志在这个记事本内。这就是蜘蛛程序的源文件,下面是下载地址,用的zip压缩包压缩了的,里面有个robots.php文件放到主题模板目录就可以了:

http://www.tianchuangseo.com/wp-content/uploads/2010/09/robots.zip

放进去了过后还要对一个文件代码进行修改才行,由于我是WordPress的博客程序,我修改的文件就是footer.php(底部)由于加载这个会对页面大小有影响,所以加载在尾部可以让影响降到最低。

本文固定链接: http://www.webzhishi.com/php_genzhong/ | web知识网

【上一篇】
【下一篇】

php跟踪蜘蛛程序:等您坐沙发呢!

发表评论