相关代码 |
|
apache web服务器日志数据清洗及用户识别软件使用说明 1,数据文件必须和程序文件放在同一个目录. 2,首先载入数据. 3,数据清洗,将在同一目录下生成cleanresult.txt文件.即清洗后的结果. 4,排序,为了提供用户识别的算法效率,请在用户识别前进行排序.同时生成排序后的文件sortresult.txt文件 5,用户识别,根据排序后的数据,采用启发式算法,识别用户,生成用户列表文件users.txt和及用户访问列表文件useridentifyresult.txt 6,运行环境为windowsxp sp2 此程序已用专业网站大约900m的日志数据测试过, 现在还在测试中,还没有完善,会有很多bug,请大家多交流. 现在在做用户群体聚类的算法,做完会及时发布新版本的. 请大家多提意见,我的email是: email: mwlwlm@163.com
相关资源 |
|