首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
文章对Web日志数据的预处理进行研究,建立了一个通用的基于Web日志数据预处理的模型。此模型主要包含数据清理、用户识别、会话识别、路径补充、格式化5个基本步骤。研究中,在用户识别步骤加入了时间维度,基于此实现的算法在一定程度上提高了Web日志中用户识别的准确度。经过预处理之后,Web日志数据由原来的半结构化被转换成结构化,并存储在数据库中,以便后期Web挖掘的开展。实践证明,该模型是可行的,并具有良好的可扩展性。  相似文献   

2.
基于Web日志挖掘中的数据预处理   总被引:2,自引:0,他引:2  
Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面,数据预处理是Web日志挖掘中的关键技术之一。本文概述了Web日志挖掘的概念和基本步骤,重点分析了数据预处理中各个环节的主要任务和实现技术,通过实例详细说明了对Web日志实施数据预处理的过程。  相似文献   

3.
对于电子商务企业而言,如何把交易相关的大量数据,通过整理、提取、加工,形成知识,对企业了解、分析客户,为客户提供更好的服务进而提高企业核心竞争力都是至关重要的。主要探讨了Web挖掘的概念、过程和技术,并结合实例分析了Web挖掘在电子商务中的具体应用。  相似文献   

4.
杨丽 《管理观察》2011,(18):195-196
主要介绍了Web挖掘的定义,并对日志挖掘进行详细的说明,介绍了常用的Web挖掘方法,本文还讨论了分类算法的实际应用,最后总结了Web挖掘在电子商务中的应用.  相似文献   

5.
Web挖掘技术在处理海量数据和稀疏数据上有着先天的优势,所以在推荐系统中Web挖掘技术得到了越来越广泛的研究和应用.文章从web挖掘的概念着手,介绍几种个性化推荐技术,并指出了推荐系统未来的研究热点和发展方向.  相似文献   

6.
Web挖掘技术在处理海量数据和稀疏数据上有着先天的优势,所以在推荐系统中Web挖掘技术得到了越来越广泛的研究和应用。文章从Web挖掘的概念着手,介绍几种个性化推荐技术,并指出了推荐系统未来的研究热点和发展方向。  相似文献   

7.
针对互联网用户访问Web服务器产生的日志。结合Web使用挖掘相关理论,采用Apriori算法挖掘用户的频繁访问模式。首先进行数据预处理以保证数据的质量及提高挖掘的效率;然后对预处理后的数据采用Apriori算法进行关联规则挖掘,找出其中的频繁访问模式;最后分析结果,总结规则,提出建议。  相似文献   

8.
刘平  曹云 《价值工程》2010,29(8):133-133
作为从浩瀚的Web信息资源中发现潜在的、有价值知识的一种有效技术,Web挖掘正悄然兴起,倍受关注。目前,Web挖掘的研究正处于发展阶段,尚无统一的结论,需要国内外学者在理论上开展更多的讨论,使Web挖掘开发对其生活发展起到推进作用,以及它所面临的挑战。  相似文献   

9.
数据丰富但知识贫乏是信息时代的一个重要现象,数据挖掘是应实际需求而出现的技术。数据预处理是数据挖掘过程中重要环节.对数据预处理技术进行研究具有现实意义。本文简单介绍了数据挖掘的概念、系统组成、及其发展前景等,重点讨论了几种常用的数据预处理方法.即数据清理、数据集成、数据变换、数据归约.并详细论述并实现了直方图算法。  相似文献   

10.
付海辰 《企业导报》2011,(6):178-179
在简要介绍Web挖掘技术的基础上,具体分析了Web内容挖掘、结构挖掘、使用挖掘在现代电子商务中的应用,指出电子商务中的Web挖掘技术是企业发展信息化和智能化的需要。  相似文献   

11.
柳胜国 《价值工程》2012,31(16):186-187
网络舆情的形成,多数情况下是由极少数个体在舆论的初期不断施加影响的结果,对这个体的初期舆论信息的发现,十分重要。利用数据挖掘技术和对WEB日志数据挖掘预处理技术,对其进行研究,可以及早发现具有影响力个体舆论倾向,建立正确的舆论导向,使网络舆情能够健康发展。  相似文献   

12.
尹立民 《价值工程》2013,(33):175-176
本论文主要针对Web挖掘领域中的Web日志挖掘领域,分析了已有的度量用户浏览兴趣方式的不足,提出了一种基于用户浏览行为度量用户浏览兴趣的方法,并通过线性回归预测方法预测了浏览兴趣度,建立了更准确的浏览访问路径树。实验表明,该方法是可行的并且具有较好的效果。  相似文献   

13.
易星 《价值工程》2011,30(11):182-183
本文主要介绍Web数据挖掘技术的相关知识及应用,并重点对Web数据挖掘技术与网络教育中主要对象即学生、教师、学校三者之间的相关挖掘应用进行了一些分析和探讨,对提升高校的网络教育管理与决策水平,营造一个现代化的、数字化学习环境,充分发挥Web数据挖掘在网络教育中的作用。  相似文献   

14.
WWW是Internet上最热门的服务之一,已经成为人们在网络上查找、浏览信息的重要手段.根据WWW的工作原理,阐述了 Linux中基于Apache软件配置个人网站的步骤,总结了配置过程中出现的问题以及解决方案,并使用html文档进行了测试.  相似文献   

15.
Panel Data模型设定的新思路--固定效应与随机效应的统一   总被引:1,自引:0,他引:1  
经典PanelData模型研究中一直存在着固定效应与随机效应的判断与争论问题,这种模型设定形式的不准确常常导致模型参数估计的无效性以及一维(one-way)与二维(two-way)误差成分模型的混淆。在此,本文提出建立一种新的同时囊括随机与固定两种效应的误差成分一般模型,其中一维(one-way)情况的模型仅为二维(two-way)模型的特例模型,单一的随机效应或固定效应模型亦为其特殊情况的一种。在这种一般误差成分模型的基础上,我们力图将有关PanelData模型的讨论纳入到一个更加一般和统一的分析构架中予以研究。  相似文献   

16.
《价值工程》2020,(2):222-223
本文通过介绍服务器日志的内涵、特点、用途以及当前日志分析方式的现状和存在的问题,分析了常用系统日志分析方法的优缺点和存在问题,提出了一种基于KNN算法改进型文本挖掘方法,并以此为基础设计了服务器日志安全预警系统架构,为服务器系统的安全监管提供了一种可行的解决方案。  相似文献   

17.
王辉  陈芸芸 《物流科技》2007,30(2):12-13
本文从同时考虑成本最小化和客户满意度的角度出发,介绍说明了配送中心选址离散决策的概念,并以此为基础建立了一个配送离散中心选址模型,同时用lingo软件为操作软件给出了一个运算实例.  相似文献   

18.
在经济学当中,经常见到结合时间序列和横截面两者的数据(即纵向数据)。纵向数据模型常涉及到随机效应,所以对它的统计分析比一般的固定效应模型要复杂得多,常用的方法或者计算烦琐,需分两少估计,或者在多数情况下不收敛,这极大地限制了对纵向数据的开发利用。本文介绍一类纵向数据模型参数估计的EM算法,这种算法能一次性的估计模型中的所有参数,而且在多数情况下是收敛的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号