首页 | 本学科首页   官方微博 | 高级检索  
     检索      

网站Web日志数据预处理模型的建立
引用本文:彭薇.网站Web日志数据预处理模型的建立[J].企业科技与发展,2010(18).
作者姓名:彭薇
作者单位:桂林电子科技大学,计算机科学与工程学院,广西,桂林,541004
摘    要:文章对Web日志数据的预处理进行研究,建立了一个通用的基于Web日志数据预处理的模型.此模型主要包含数据清理、用户识别、会话识别、路径补充、格式化5个基本步骤.研究中,在用户识别步骤加入了时闻维度,基于此实现的算法在一定程度上提高了Web日志中用户识别的准确度.经过预处理之后,Web日志数据由原来的半结构化被转换成结构化,并存储在数据库中,以便后期Web挖掘的开展.实践证明,该模型是可行的,并具有良好的可扩展性.

关 键 词:Web挖掘  数据预处理  会话

The Set-up of Preprocessing Model of Web Site Web Log Data
Authors:PENG Wei
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号