urchin的安装及使用

Urchin是google收购的一个日志分析工具。界面跟google analytics是几乎完全一样的。但是google analytics每个月的统计只能在500W PV以内,这个对于稍微有点规模的网站是不可忍受的。所以我们还是需要自己来架设一个urchin 首先需要下载一个urchin6600_linux2.6_kernel.tar.gz 这个是根据自己monitor的系统版本来进行确定的。然后还需要有一个mysql或者postgresql 创建相应的数据库和数据库用户。这里数据库名为urchin,数据库账户为urchin,urchin的账户密码为urchinapassword, urchin账户拥有urchin库的all权限。

1
2
3
root@urchin# mysql -u root -p
mysql> create database urchin character set utf8;
mysql> GRANT ALL ON urchin.* to 'urchin'@'localhost' IDENTIFIED BY 'urchinpassword';

接着使用程序目录下的install.sh脚本进行安装,这里主要是选择安装目录,数据库配置连接等等。

1
./install.sh

安装时,如果MYSQL Server为localhost时,SQL Socket path路径可能为/var/lib/mysql/mysql.sock/tmp/mysql.sock 根据实际情况填写。如果MYSQL Server为远程服务器,填写地址后,则需填写SQL Port。

安装完成后就可以通过下列网址查看urchin。

http://yourserver:9999

修改admin用户的密码,默认密码为:urchin

1
/usr/local/urchin/util/uconf-manager table=uusers action=update ucus_name="admin" ucus_password="123456" key1=ucus_name print=status

这里是把admin用户的密码设置为123456

这样我们就能通过上面的网站看到urchin的界面了。

其他配置:

首先需要一个域名下放置urchin.js这个js代码。这个代码需要修改如下部分。

1
2
3
//-- UTM User Settings
var _udn="liudongkai.com"; //这个是你网站一级目录
var _ugifpath="http://track.liudongkai.com/__utm.gif"; //__utm.gif的地址

track.liudongkai.com 这个最好是独立的域名,这样urchin就不会分析这个域名内其他不相关的日志了。

__utm.gif和urchin.js都在安装文件中存在,根据上面的建议进行修改和放置。

PS:如果你希望直接放在当前域名下,需要apache对于gif这类请求只记录__utm.gif,配置时加上 SetEnvIf Request_URI "^((?!__utm).)*\.gif$" dontlog ,当前当前域名don’t log所配置的内容。

关于日志配置:

默认nginx的日志格式,urchin是无法进行分析的。还必须要做相应的修改后urchin才能进行分析。

1
2
3
log_format urchin '$remote_addr $http_host - [$time_local] "$request" '
'$status $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_cookie"';

默认Apache的日志格式,需要在LogFormat中再添加一中格式定义,或者在原有的combined格式中追加%{Cookie}i 。

1
LogFormat "%h %v %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\" \"%{Cookie}i\"" urchin

新建配置:

Urchin默认是英文界面,可以在显示中选择中文。基本设置如下:

urchin的原理:就是在所有的页面都会嵌入这个urchin.js来访问那个__utm.gif图片,通过这个来收集用户本地的相关信息来记录到gif图片域名下的日志中,然后urchin就来分析这个日志,所以这个分析结果的内容会比一般的多。

Urchin 参数

Urchin 参数