给AWStats增加针对Googlebot/Baiduspider/Yahoo!Slurp/MSNBot的详细统计

虽然AWStats中提供了蜘蛛的分类统计:

搜索引擎网站的机器人 (前 10) – 全部列出 – 最近参观日期

>102 个机器人* 文件数 字节 最近参观日期
Sina Iask Spider 41894 520.80 M字节 2006年 九月 09日 07:17
GouGou 34577 920.11 M字节 2006年 九月 09日 12:23
Googlebot 12171+39 212.60 M字节 2006年 九月 09日 12:23
Yahoo Slurp 5775+1275 91.10 M字节 2006年 九月 09日 12:24
GigaBot 5334+233 53.62 M字节 2006年 九月 09日 12:24
Unknown robot (identified by ‘robot’) 5421+6 71.46 M字节 2006年 九月 09日 12:17
Lilina 5278 76.67 M字节 2006年 九月 09日 12:22
MSNBot 4075+217 52.31 M字节 2006年 九月 09日 12:19
Yahoo! Slurp China 3135+460 25.83 M字节 2006年 九月 09日 12:21
Unknown robot (identified by ‘crawl’) 3431+6 78.98 M字节 2006年 九月 09日 12:23

有汇总后的数据,但是每个蜘蛛具体抓取了那些页面和抓取的频度就无法得知了,利用AWStats的扩展配置,统计也可以详细到每个蜘蛛的具体访问(参考了http://www.antezeta.com/awstats.html上的配置样例)。

注意:配置完Extra后可能会遇到以下这样的警告:

Phase 2 : Now process new records (Flush history on disk after 20000 hosts)…
Error: The number of values found for extra section 5 has grown too large.
In order to prevent awstats from using an excessive amount of memory, the number of values is currently limited to 500. Perhaps you should consider revising extract parameters for extra section 5. If you are certain you want to track such a large data set, you can increase the limit by setting ExtraTrackedRowsLimit in your awstats configuration file.

如果扩展配置统计的条目较多,比如:蜘蛛抓取的不同URL的个数很多,就需要在全局扩大一下ExtraTrackedRowsLimit这个参数, 这个参数不像其他参数一样需要加编号,缺省最多统计500个项目,我扩大到了2万,ExtraTrackedRowsLimit=20000

完整设置如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
ExtraSectionName5="Google crawls – Top 50"
ExtraSectionCodeFilter5="200 304"
ExtraSectionCondition5="UA,(.*Googlebot.*)"
ExtraSectionFirstColumnValues5="URL,(.*)"
ExtraSectionFirstColumnFormat5="<a href='%s' title='Item Crawled' target='_blank'>%s</a>"
ExtraSectionStatTypes5=PHBL
ExtraSectionAddAverageRow5=0
ExtraSectionAddSumRow5=5
MaxNbOfExtra5=50
MinHitExtra5=1ExtraSectionName6="Baidu crawls – Top 50"
ExtraSectionCodeFilter6="200 304"
ExtraSectionCondition6="UA,(.*Baiduspider.*)"
ExtraSectionFirstColumnValues6="URL,(.*)"
ExtraSectionFirstColumnFormat6="<a href='%s' title='Item Crawled' target='_blank'>%s</a>"
ExtraSectionStatTypes6=PHBL
ExtraSectionAddAverageRow6=0
ExtraSectionAddSumRow6=6
MaxNbOfExtra6=50
MinHitExtra6=1

ExtraSectionName7="Yahoo Slurp crawls – Top 50"
ExtraSectionCodeFilter7="200 304"
ExtraSectionCondition7="UA,(.*Slurp.*)"
ExtraSectionFirstColumnValues7="URL,(.*)"
ExtraSectionFirstColumnFormat7="<a href='%s' title='Item Crawled' target='_blank'>%s</a>"
ExtraSectionStatTypes7=PHBL
ExtraSectionAddAverageRow7=0
ExtraSectionAddSumRow7=7
MaxNbOfExtra7=50
MinHitExtra7=1

ExtraSectionName8="MSN crawls – Top 50"
ExtraSectionCodeFilter8="200 304"
ExtraSectionCondition8="UA,(.*msnbot.*)"
ExtraSectionFirstColumnValues8="URL,(.*)"
ExtraSectionFirstColumnFormat8="<a href='%s' title='Item Crawled' target='_blank'>%s</a>"
ExtraSectionStatTypes8=PHBL
ExtraSectionAddAverageRow8=0
ExtraSectionAddSumRow8=8
MaxNbOfExtra8=50
MinHitExtra8=1

ExtraSectionName9="Sohu crawls – Top 50"
ExtraSectionCodeFilter9="200 304"
ExtraSectionCondition9="UA,(.*sogou.*)"
ExtraSectionFirstColumnValues9="URL,(.*)"
ExtraSectionFirstColumnFormat9="<a href='%s' title='Item Crawled' target='_blank'>%s</a>"
ExtraSectionStatTypes9=PHBL
ExtraSectionAddAverageRow9=0
ExtraSectionAddSumRow9=9
MaxNbOfExtra9=50
MinHitExtra9=1

ExtraTrackedRowsLimit=20000

输出样例: 从中可以发现一些蜘蛛的特点,百度只抓取中文内容,而在robots.txt的遵循上,百度是先抓后删,而Google/Yahoo!/MSN则从抓取队列中就会删除。而仍然不知是谁家的outfoxbot似乎对图片更感兴趣……

Google crawls – Top 50

  网页数 文件数 字节 最近参观日期
/blog/ 41 41 272.41 K字节 2006年 九月 09日 20:37
/phpMan.php/phpinfo 4 4 110.92 K字节 2006年 九月 09日 19:27
/u2/lyrics.txt 4 4 221.90 K字节 2006年 九月 09日 20:55
/bbcweb/9.htm 4 4 4.91 K字节 2006年 九月 09日 21:58
/digest/20060907.html 3 3 26.60 K字节 2006年 九月 09日 20:55
/bbcweb/4.htm 3 3 3.15 K字节 2006年 九月 09日 21:58
/tech/lucene.html 3 3 64.98 K字节 2006年 九月 09日 21:59
/ 3 3 124.52 K字节 2006年 九月 09日 20:03
/robots.txt 3 3 696 个字节 2006年 九月 09日 17:49
/phpMan.php/man/perlform/1 3 3 68.74 K字节 2006年 九月 09日 23:47
/sitemap.html 3 3 14.90 K字节 2006年 九月 09日 01:49
/bbcweb/1.htm 3 3 6.34 K字节 2006年 九月 09日 21:58
/tech/ 3 3 14.39 K字节 2006年 九月 09日 20:55
/side_by_side/google_yahoo.html 3 3 1.14 K字节 2006年 九月 09日 20:55
/phpMan.php/man/hotplug/8 3 3 18.57 K字节 2006年 九月 09日 02:55
/phpMan.php/man/perllexwarn/1 3 3 60.44 K字节 2006年 九月 09日 23:47
/tech/acdsee.html 3 3 10.17 K字节 2006年 九月 09日 21:58
/digest/20060906.html 3 3 50.66 K字节 2006年 九月 09日 16:28
/tech/rotate_merge_log.html 3 3 91.96 K字节 2006年 九月 09日 16:56
/digest/20060905.html 3 3 56.00 K字节 2006年 九月 09日 16:28
/phpMan.php 3 3 7.94 K字节 2006年 九月 09日 04:30
/tech/study.html 3 3 19.62 K字节 2006年 九月 09日 21:58
/bbcweb/8.htm 3 3 4.77 K字节 2006年 九月 09日 21:59
/tech/oracle.html 3 3 19.57 K字节 2006年 九月 09日 21:59
/phpMan.php/man/curl_global_init/3 2 2 7.79 K字节 2006年 九月 09日 01:23
/tech/gnu.html 2 2 7.15 K字节 2006年 九月 09日 21:58
/tech/weblog.html 2 2 13.36 K字节 2006年 九月 09日 21:59
/phpMan.php/search/(2) 2 2 124.43 K字节 2006年 九月 09日 04:53
/tech/indent_tools.html 2 2 34.31 K字节 2006年 九月 09日 22:23
/blog/archives/001146.html 2 2 50.66 K字节 2006年 九月 09日 17:40
/phpMan.php/man/grubby/8 2 2 23.48 K字节 2006年 九月 09日 06:03
/bbcweb/10.htm 2 2 3.04 K字节 2006年 九月 09日 21:58
/blog/archives/001164.html 2 2 45.14 K字节 2006年 九月 09日 13:00
/phpMan.php/search/(6) 2 2 16.36 K字节 2006年 九月 09日 04:16
/phpMan.php/man/pdf2dsc/1 2 2 7.96 K字节 2006年 九月 09日 23:25
/phpMan.php/man/req/1 2 2 51.25 K字节 2006年 九月 09日 21:34
/tech/mysql.html 2 2 28.71 K字节 2006年 九月 09日 21:58
/blog/archives/001169.html 2 2 36.42 K字节 2006年 九月 09日 14:07
/phpMan.php/man/iopl/2 2 2 7.90 K字节 2006年 九月 09日 23:25
/phpMan.php/man/stdout/3 2 2 13.16 K字节 2006年 九月 09日 19:27
/phpMan.php/man/charset/1 2 2 4.40 K字节 2006年 九月 09日 04:33
/tech/google_ads.html 2 2 11.53 K字节 2006年 九月 09日 04:11
/phpMan.php/search/(9) 2 2 28.15 K字节 2006年 九月 09日 04:16
/phpMan.php/search/(8) 2 2 126.83 K字节 2006年 九月 09日 04:16
/tech/awstats.html 2 2 39.49 K字节 2006年 九月 09日 21:59
/tech/nat.html 2 2 18.39 K字节 2006年 九月 09日 21:59
/blog/archives/001199.html 2 2 18.38 K字节 2006年 九月 09日 15:45
/rolling_stones/stones/the_rolling_stones.smi 2 2 8.96 K字节 2006年 九月 09日 12:14
/blog/archives/001198.html 2 2 35.09 K字节 2006年 九月 09日 20:55
/phpMan.php/man/isdnctrl/8 2 2 40.42 K字节 2006年 九月 09日 23:32
总数 165 165 2.03 M字节

Baidu crawls – Top 50

  网页数 文件数 字节 最近参观日期
/ 8 8 306.07 K字节 2006年 九月 09日 17:22
/robots.txt 4 4 928 个字节 2006年 九月 09日 14:30
/blog/ 4 4 220.84 K字节 2006年 九月 09日 15:34
/linkPopCheck.php 4 4 8.70 K字节 2006年 九月 09日 21:11
/blog/archives/001199.html 4 4 73.53 K字节 2006年 九月 09日 17:22
/phpMan.php 3 3 9.57 K字节 2006年 九月 09日 19:27
/blog/archives/001109.html 2 2 69.52 K字节 2006年 九月 09日 08:34
/tech/google_url.html 1 1 10.40 K字节 2006年 九月 09日 15:34
/blog/archives/001161.html 1 1 17.67 K字节 2006年 九月 09日 14:18
/cgi-bin/mt/mt-atom.cgi/weblog/blog_id=1 1 1 1.07 K字节 2006年 九月 09日 17:55
/blog/archives/000651.html 1 1 12.81 K字节 2006年 九月 09日 18:43
/blog/archives/000638.html 1 1 35.87 K字节 2006年 九月 09日 18:42
/blog/archives/001146.html 1 1 25.33 K字节 2006年 九月 09日 10:38
/blog/archives/000625.html 1 1 22.62 K字节 2006年 九月 09日 18:43
/blog/archives/000220.html 1 1 10.65 K字节 2006年 九月 09日 18:43
/blog/archives/001157.html 1 1 15.73 K字节 2006年 九月 09日 03:37
/digest/20050621.html 1 1 12.36 K字节 2006年 九月 09日 21:11
/blog/archives/000011.html 1 1 24.25 K字节 2006年 九月 09日 07:12
/blog/archives/000454.html 1 1 11.52 K字节 2006年 九月 09日 18:43
/digest/20060120.html 1 1 12.36 K字节 2006年 九月 09日 10:57
/tech/apache_install.html 1 1 12.36 K字节 2006年 九月 09日 01:25
/blog/archives/001052.html 1 1 12.56 K字节 2006年 九月 09日 18:43
/cgi-bin/mt/mt-atom.cgi/weblog/blog_id=1/entry_id=1174 1 1 1.07 K字节 2006年 九月 09日 10:57
/blog/archives/001094.html 1 1 19.27 K字节 2006年 九月 09日 18:43
/blog/archives/000519.html 1 1 16.59 K字节 2006年 九月 09日 18:43
/blog/archives/000950.html 1 1 29.79 K字节 2006年 九月 09日 18:42
/digest/20060908.html 1 1 18.01 K字节 2006年 九月 09日 17:22
/tech/google.html 1 1 12.36 K字节 2006年 九月 09日 15:34
/blog/archives/001164.html 1 1 22.57 K字节 2006年 九月 09日 00:37
/blog/archives/000005.html 1 1 10.27 K字节 2006年 九月 09日 07:12
/blog/archives/001182.html 1 1 16.05 K字节 2006年 九月 09日 03:02
/blog/archives.html 1 1 12.36 K字节 2006年 九月 09日 22:41
/blog/archives/001085.html 1 1 14.31 K字节 2006年 九月 09日 18:43
/blog/archives/001131.html 1 1 27.04 K字节 2006年 九月 09日 11:18
/bbcweb/204.htm 1 1 3.05 K字节 2006年 九月 09日 21:11
/site_search.php 1 1 1.54 K字节 2006年 九月 09日 08:36
/blog/archives/001040.html 1 1 20.35 K字节 2006年 九月 09日 18:43
/blog/archives/001139.html 1 1 24.43 K字节 2006年 九月 09日 18:42
/blog/archives/000859.html 1 1 16.03 K字节 2006年 九月 09日 05:46
/digest/20050926.html 1 1 12.36 K字节 2006年 九月 09日 21:11
/blog/archives/000284.html 1 1 25.01 K字节 2006年 九月 09日 18:43
/blog/archives/2005_12.html 1 1 12.36 K字节 2006年 九月 09日 22:55
/blog/archives/000741.html 1 1 12.36 K字节 2006年 九月 09日 08:35
/blog/archives/000498.html 1 1 10.55 K字节 2006年 九月 09日 18:43
/bbcweb/218.htm 1 1 3.61 K字节 2006年 九月 09日 10:57
/tech/cvs.ppt 1 1 12.34 K字节 2006年 九月 09日 08:40
/blog/archives/000645.html 1 1 14.01 K字节 2006年 九月 09日 18:43
/blog/archives/000632.html 1 1 10.22 K字节 2006年 九月 09日 18:43
/blog/archives/001124.html 1 1 53.21 K字节 2006年 九月 09日 04:14
/blog/archives/001044.html 1 1 13.90 K字节 2006年 九月 09日 08:40
总数 72 72 1.34 M字节

Yahoo Slurp crawls – Top 50

  网页数 文件数 字节 最近参观日期
/robots.txt 104 104 23.56 K字节 2006年 九月 09日 23:38
/ 16 16 665.58 K字节 2006年 九月 09日 23:36
/blog/archives/001189.html 8 8 102.40 K字节 2006年 九月 09日 22:12
/tech/indent_tools.html 7 7 117.59 K字节 2006年 九月 09日 22:39
/tech/google.html 7 7 251.04 K字节 2006年 九月 09日 23:32
/blog/ 6 6 329.88 K字节 2006年 九月 09日 23:19
/tech/apache_install.html 5 5 90.00 K字节 2006年 九月 09日 23:15
/blog/archives/001196.html 5 5 173.59 K字节 2006年 九月 09日 23:48
/blog/archives/000751.html 5 5 104.12 K字节 2006年 九月 09日 23:21
/blog/archives/001197.html 5 5 174.99 K字节 2006年 九月 09日 22:37
/tech/lucene.html 4 4 136.91 K字节 2006年 九月 09日 23:57
/blog/archives/000828.html 4 4 107.72 K字节 2006年 九月 09日 23:27
/tech/link_pop_check.html 4 4 44.79 K字节 2006年 九月 09日 23:04
/tech/cms.html 4 4 61.17 K字节 2006年 九月 09日 22:13
/tech/awstats.html 4 4 56.19 K字节 2006年 九月 09日 22:58
/linkPopCheck.php 4 4 8.65 K字节 2006年 九月 09日 21:39
/blog/archives/001199.html 4 4 55.15 K字节 2006年 九月 09日 22:14
/blog/archives/000644.html 3 3 81.88 K字节 2006年 九月 09日 19:52
/tech/cvs_card.html 3 3 82.04 K字节 2006年 九月 09日 22:44
/blog/archives/000001.html 3 3 93.52 K字节 2006年 九月 09日 23:23
/blog/archives/001198.html 3 3 35.09 K字节 2006年 九月 09日 22:49
/blog/archives/cat_tech_notes.html 2 2 509.34 K字节 2006年 九月 09日 23:48
/phpMan.php/man/pkgCache::PkgFileIterator 2 2 4.08 K字节 2006年 九月 09日 23:58
/digest/20060908.html 2 2 36.03 K字节 2006年 九月 09日 19:40
/tech/resin.html 2 2 18.64 K字节 2006年 九月 09日 18:24
/blog/archives/000496.html 2 2 32.08 K字节 2006年 九月 09日 18:22
/blog/archives/000741.html 2 2 77.94 K字节 2006年 九月 09日 21:56
/blog/archives/000790.html 2 2 47.28 K字节 2006年 九月 09日 22:03
/phpMan.php/man/FindBin/3 1 1 5.18 K字节 2006年 九月 09日 14:08
/phpMan.php/man/chr/11 1 1 8.74 K字节 2006年 九月 09日 18:47
/phpMan.php/man/Win32::API 1 1 1.98 K字节 2006年 九月 09日 23:02
/phpMan.php/man/ocsp/1ssl 1 1 2.05 K字节 2006年 九月 09日 23:53
/tech/gnu.html 1 1 7.15 K字节 2006年 九月 09日 20:07
/phpMan.php/man/foomatic-datafile/1 1 1 2.01 K字节 2006年 九月 09日 18:21
/phpMan.php/man/pkgCache::PrvIterator 1 1 2.03 K字节 2006年 九月 09日 18:11
/phpMan.php/man/INVARIANT/3 1 1 1.98 K字节 2006年 九月 09日 20:54
/phpMan.php/man/Apache::TestMB 1 1 2.00 K字节 2006年 九月 09日 22:47
/phpMan.php/man/DBM::Deep 1 1 1.98 K字节 2006年 九月 09日 18:34
/phpMan.php/man/Pod::Select 1 1 13.29 K字节 2006年 九月 09日 21:21
/digest/20051218.html 1 1 0 2006年 九月 09日 23:44
/phpMan.php/man/Other::CONST 1 1 1.99 K字节 2006年 九月 09日 23:21
/blog/archives/001146.html 1 1 25.33 K字节 2006年 九月 09日 11:44
/phpMan.php/man/DH_check/3ssl 1 1 2.10 K字节 2006年 九月 09日 16:15
/phpMan.php/man/fxload/8 1 1 11.27 K字节 2006年 九月 09日 19:44
/phpMan.php/man/VOP_LEASE/9 1 1 1.99 K字节 2006年 九月 09日 14:22
/phpMan.php/man/XCopyArea/3x 1 1 1.98 K字节 2006年 九月 09日 14:27
/phpMan.php/man/log/3 1 1 3.07 K字节 2006年 九月 09日 23:28
/digest/20050525.html 1 1 23.48 K字节 2006年 九月 09日 23:41
/phpMan.php/man/Data::Buffer/3 1 1 2.00 K字节 2006年 九月 09日 16:57
/blog/archives/000661.html 1 1 20.83 K字节 2006年 九月 09日 22:28
总数 244 244 3.58 M字节

MSN crawls – Top 50

  网页数 文件数 字节 最近参观日期
/robots.txt 9 9 2.04 K字节 2006年 九月 09日 20:38
/phpMan.php/man/getpwnam/lgn 3 3 21.21 K字节 2006年 九月 09日 23:45
/phpMan.php/man/CGI::Session 2 2 53.71 K字节 2006年 九月 09日 23:48
/side_by_side/search_form_utf8.html 2 2 1.57 K字节 2006年 九月 09日 19:06
/phpMan.php/man/munlockall/2 1 1 3.39 K字节 2006年 九月 09日 20:07
/ 1 1 6.63 K字节 2006年 九月 09日 16:20
/blog/archives/001083.html 1 1 15.91 K字节 2006年 九月 09日 17:13
/blog/archives/cat_appinstall.html 1 1 98.97 K字节 2006年 九月 09日 19:05
/phpMan.php/man/rpc.nfsd/8 1 1 4.26 K字节 2006年 九月 09日 18:20
/bbcweb/223.htm 1 1 2.48 K字节 2006年 九月 09日 14:26
/blog/archives/001047.html 1 1 19.07 K字节 2006年 九月 09日 17:47
/phpMan.php/man/isdntime/5 1 1 1.94 K字节 2006年 九月 09日 15:09
/phpMan.php/man/SSL_CTX_set_session_cache_mode/3 1 1 8.29 K字节 2006年 九月 09日 20:25
/phpMan.php/man/XML::PerlSAX::DOM 1 1 1.97 K字节 2006年 九月 09日 22:19
/blog/archives/000738.html 1 1 13.47 K字节 2006年 九月 09日 20:38
/phpMan.php/man/unzipsfx/1 1 1 17.98 K字节 2006年 九月 09日 20:45
/phpMan.php/man/mbadblocks/1 1 1 4.64 K字节 2006年 九月 09日 14:10
/phpMan.php/man/wmemchr/3p 1 1 4.37 K字节 2006年 九月 09日 22:51
/blog/archives/000220.html 1 1 10.65 K字节 2006年 九月 09日 14:34
/blog/archives/000208.html 1 1 9.65 K字节 2006年 九月 09日 15:58
/phpMan.php/man/integer/3pm 1 1 11.47 K字节 2006年 九月 09日 22:34
/blog/archives/000550.html 1 1 11.97 K字节 2006年 九月 09日 11:48
/phpMan.php/man/cut/1p 1 1 15.37 K字节 2006年 九月 09日 12:28
/blog/archives/000454.html 1 1 11.52 K字节 2006年 九月 09日 11:58
/phpMan.php/man/adsl-start/8 1 1 3.68 K字节 2006年 九月 09日 22:46
/phpMan.php/man/df/1 1 1 5.58 K字节 2006年 九月 09日 16:00
/phpMan.php/man/mmove/1 1 1 4.82 K字节 2006年 九月 09日 18:36
/blog/archives/2006_03.html 1 1 33.75 K字节 2006年 九月 09日 23:52
/phpMan.php/man/adsl-setup/8 1 1 3.48 K字节 2006年 九月 09日 20:41
/tech/robots.pm 1 1 78.83 K字节 2006年 九月 09日 20:13
/phpMan.php/man/ash/1 1 1 15.46 K字节 2006年 九月 09日 20:56
/blog/archives/001164.html 1 1 22.57 K字节 2006年 九月 09日 17:17
/phpMan.php/man/CGI::Session::ErrorHandler/3pm 1 1 2.11 K字节 2006年 九月 09日 19:57
/phpMan.php/man/sem_open/3p 1 1 9.64 K字节 2006年 九月 09日 23:19
/phpMan.php/man/locale/5 1 1 15.30 K字节 2006年 九月 09日 20:14
/phpMan.php/man/clock/3p 1 1 4.84 K字节 2006年 九月 09日 13:21
/phpMan.php/man/tiffgt/1 1 1 8.38 K字节 2006年 九月 09日 14:40
/blog/archives/001081.html 1 1 14.33 K字节 2006年 九月 09日 18:26
/phpMan.php/man/stime/2 1 1 3.19 K字节 2006年 九月 09日 15:06
/blog/archives/000656.html 1 1 17.83 K字节 2006年 九月 09日 17:33
/tech/google_ads.html 1 1 15.55 K字节 2006年 九月 09日 19:23
/phpMan.php/man/uuid_parse/3 1 1 3.73 K字节 2006年 九月 09日 12:13
/bbcweb/ 1 1 2.40 K字节 2006年 九月 09日 12:45
/phpMan.php/man/SSL_CTX_add_session/3 1 1 4.94 K字节 2006年 九月 09日 21:12
/phpMan.php/man/diskdumpctl/8 1 1 3.28 K字节 2006年 九月 09日 14:55
/phpMan.php/man/passwd/1 1 1 9.06 K字节 2006年 九月 09日 19:43
/blog/archives/000805.html 1 1 20.12 K字节 2006年 九月 09日 17:11
/bbcweb/2.htm 1 1 1.88 K字节 2006年 九月 09日 15:58
/phpMan.php/man/gzcat/1L 1 1 1.93 K字节 2006年 九月 09日 15:15
/phpMan.php/man/string/3 1 1 6.71 K字节 2006年 九月 09日 22:49
总数 62 62 665.90 K字节

Sohu crawls – Top 50

  网页数 文件数 字节 最近参观日期
/blog/archives/000955.html 3 3 46.87 K字节 2006年 九月 09日 23:34
/tech/gnu.html 1 1 7.14 K字节 2006年 九月 09日 15:55
/blog/archives/000728.html 1 1 48.14 K字节 2006年 九月 09日 23:00
/blog/archives/000100.html 1 1 15.54 K字节 2006年 九月 09日 19:45
/blog/archives/000012.html 1 1 23.06 K字节 2006年 九月 09日 16:02
/digest/20060701.html 1 1 39.31 K字节 2006年 九月 09日 12:38
/digest/20050823.html 1 1 43.52 K字节 2006年 九月 09日 13:12
/blog/archives/2004_02.html 1 1 48.14 K字节 2006年 九月 09日 20:59
/digest/20060703.html 1 1 45.31 K字节 2006年 九月 09日 20:54
/blog/archives/000646.html 1 1 51.85 K字节 2006年 九月 09日 16:29
/index.php/blog/tech/index.php/side_by_side/google_yahoo.html 1 1 41.31 K字节 2006年 九月 09日 13:27
/blog/archives/001058.html 1 1 70.79 K字节 2006年 九月 09日 11:55
/blog/archives/000267.html 1 1 27.10 K字节 2006年 九月 09日 20:01
总数 15 15 508.09 K字节

OutfoxBot crawls – Top 50

  网页数 文件数 字节 最近参观日期
/robots.txt 3 3 696 个字节 2006年 九月 09日 15:53
/blog/archives/newsgator_buzz.png   1 5.95 K字节 2006年 九月 09日 15:53
/blog/archives/pairs.png   1 84.68 K字节 2006年 九月 09日 15:01
/blog/archives/firefox-rss.png   1 29.18 K字节 2006年 九月 09日 15:03
/blog/archives/pairs_wikipedia.png   1 84.56 K字节 2006年 九月 09日 13:19
/blog/archives/newsgator-incoming.png   1 5.82 K字节 2006年 九月 09日 15:02
总数 3 8 210.87 K字节