网站Web日志数据预处理模型的建立 |
| |
引用本文: | 彭薇.网站Web日志数据预处理模型的建立[J].企业科技与发展,2010(18). |
| |
作者姓名: | 彭薇 |
| |
作者单位: | 桂林电子科技大学,计算机科学与工程学院,广西,桂林,541004 |
| |
摘 要: | 文章对Web日志数据的预处理进行研究,建立了一个通用的基于Web日志数据预处理的模型.此模型主要包含数据清理、用户识别、会话识别、路径补充、格式化5个基本步骤.研究中,在用户识别步骤加入了时闻维度,基于此实现的算法在一定程度上提高了Web日志中用户识别的准确度.经过预处理之后,Web日志数据由原来的半结构化被转换成结构化,并存储在数据库中,以便后期Web挖掘的开展.实践证明,该模型是可行的,并具有良好的可扩展性.
|
关 键 词: | Web挖掘 数据预处理 会话 |
The Set-up of Preprocessing Model of Web Site Web Log Data |
| |
Authors: | PENG Wei |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|