首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
吴常辉  左春荣 《价值工程》2010,29(2):194-195
关联规则反映了大量数据中项集之间的相互依存性和关联性。Apriori算法是关联规则挖掘中的经典算法。本文在对Apriori算法分析的基础上,针对该算法存在的缺陷,即会产生大量冗余的候选集并频繁扫描数据库,提出了改进的Apriori算法,并给予验证。实践证明,改进后的算法效率优于传统的算法。  相似文献   

2.
马蓉 《价值工程》2013,(30):182-185
Apriori算法是一种最具有影响力的挖掘布尔关联规则频繁项集的算法。然而,在产生频繁项集时,需要多次扫描事务数据库,并产生庞大的候选集。为了降低算法的时间复杂度,提高程序运行效率,提出了一种改进的Apriori算法。同时,以某一高职院校中已毕业学生和在校生的就业信息为基础,建立了就业事务数据库,运用改进的Apriori算法对就业数据进行处理,产生了频繁项集。根据最小支持度和最小置信度的定义,找出强关联规则。并引入重要性对强关联规则进行分析,发现具有实际意义的信息,为高职学校就业指导提供决策,为学生就业提供了若干意见。  相似文献   

3.
《价值工程》2015,(26):245-249
随着移动通信技术的飞速发展,移动电子商务以其方便、快捷等优点获得了大量的网络用户。移动互联网端的用户行为分析已经成为迅速发展的知识领域。Web数据挖掘技术作为用户行为分析的基础在移动电子商务领域具有很高的实用价值。文章主要介绍了基于Web的数据挖掘定义及Web的数据特点,并对Web使用模式挖掘的过程和算法进行了重点分析,包括数据的预处理、模式发现和模式分析。除此之外,基于传统企业的电子商务化、业务领域多元化等特点,创新研究了如何建设企业电子化大平台,如何有效收集平台产生的海量数据,如何将Web数据挖掘技术应用于企业等内容。  相似文献   

4.
文章对Web日志数据的预处理进行研究,建立了一个通用的基于Web日志数据预处理的模型.此模型主要包含数据清理、用户识别、会话识别、路径补充、格式化5个基本步骤.研究中,在用户识别步骤加入了时闻维度,基于此实现的算法在一定程度上提高了Web日志中用户识别的准确度.经过预处理之后,Web日志数据由原来的半结构化被转换成结构化,并存储在数据库中,以便后期Web挖掘的开展.实践证明,该模型是可行的,并具有良好的可扩展性.  相似文献   

5.
罗刚 《企业导报》2012,(10):251
随着大量数据不断收集和存储,许多业界人士对于从他们的数据库中挖掘关联规则越来越感兴趣。Apriori算法就是经典的关联挖掘算法,文章分析了Apriori的算法思想、算法具体方法及其不足。  相似文献   

6.
文章对Web日志数据的预处理进行研究,建立了一个通用的基于Web日志数据预处理的模型。此模型主要包含数据清理、用户识别、会话识别、路径补充、格式化5个基本步骤。研究中,在用户识别步骤加入了时间维度,基于此实现的算法在一定程度上提高了Web日志中用户识别的准确度。经过预处理之后,Web日志数据由原来的半结构化被转换成结构化,并存储在数据库中,以便后期Web挖掘的开展。实践证明,该模型是可行的,并具有良好的可扩展性。  相似文献   

7.
朱晓东  戴悦 《价值工程》2007,26(7):111-113
使用关联规则进行数据挖掘时,使用者为了达到一定的挖掘效果,经常需要不断地改变关联规则的支持度阈值(support)。文中提出了一种从大型数据库中挖掘关联规则的快速算法。该算法以经典的Apriori算法为基础,可以在提出新的支持度后,直接在首次挖掘的基础上进行再一次挖掘。结果表明,它较Apriori算法的实现速度有明显的提高。  相似文献   

8.
从Web服务器日志文件和客户交易数据中挖掘有意义的用户访问模式和潜在的客户群,有助于企业提供个性化信息服务和开展有针对性的电子商务活动。本文基于Web挖掘的聚类技术,提出了一种电子商务中个性化推荐系统的具体实现方案。  相似文献   

9.
Web使用挖掘是Web数据挖掘的一种,通过分析用户浏览网站的模式,发现对企业决策、管理有用的知识与信息。本文介绍了几种常见的Web使用挖掘方式和相应算法,并说明了它们在企业经营中的具体应用。  相似文献   

10.
《价值工程》2013,(10):183-184
随着通信行业的蓬勃发展,运营商给用户提供的服务水平也不断提高,因此也给通信设备的维护工作提出了更高的要求。在移动网管领域中,设备告警的监控及处理工作始终都是至关重要的工作之一,最近几年网管系统已经实现了设备告警关联呈现,但告警关联功能是依赖于设备告警的关联规则的,目前告警关联规则都是靠维护人员的经验总结出来的,如何能够经过分析自动发现未知的告警关联规则是亟待解决的问题。运用Apriori算法通过对大量历史告警数据的分析可以实现挖掘告警数据中的频繁项集最终发现告警关联规则。  相似文献   

11.
Web使用挖掘是Web数据挖掘的一种,通过分析用户浏览网站的模式。发现对企业决策、管理有用的知识与信息。本文介绍了几种常见的Web使用挖掘方式和相应算法,并说明了它们在企业经营中的具体应用。  相似文献   

12.
Web使用挖掘是Web数据挖掘的一种,通过分析用户浏览网站的模式,发现对企业决策、管理有用的知识与信息.本文介绍了几种常见的Web使用挖掘方式和相应算法,并说明了它们在企业经营中的具体应用.  相似文献   

13.
《价值工程》2018,(5):171-173
关联规则挖掘是数据挖掘领域研究的热点问题,其中Apriori算法是经典的关联规则算法。将关联规则Apriori算法应用到学生成绩分析中,挖掘出课程与课程之间的相互关系,寻找各方面影响学生成绩的因素,发现隐藏在数据背后有价值的信息,从而为学生选课和教师教学以及教学管理工作等提供辅助性的建议与决策。  相似文献   

14.
数据挖掘是一种新兴的信息处理技术,它通过对商业数据的分析处理,可以发现蕴藏在数据中的商业知识,挖掘数据内在的联系、规则和模式,辅助商业决策。在电子商务环境下的数据挖掘的研究,主要是进行客户访问信息的挖掘.文章在考虑了数据来源之后,简要介绍数据预处理过程.最后给出了模糊集与传统的关联规则挖掘结合的算法。  相似文献   

15.
基于Web日志挖掘中的数据预处理   总被引:2,自引:0,他引:2  
Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面,数据预处理是Web日志挖掘中的关键技术之一。本文概述了Web日志挖掘的概念和基本步骤,重点分析了数据预处理中各个环节的主要任务和实现技术,通过实例详细说明了对Web日志实施数据预处理的过程。  相似文献   

16.
《价值工程》2013,(6):174-176
用户建模是数字图书馆个性化推荐系统中的关键技术,本文依据中图法对用户兴趣进行了建模,并通过Apriori关联规则算法挖掘了信息资源各类别间的关联,然后通过FCM算法对用户进行聚类分析得到目标用户的最近邻,在Top_n最近邻居集中通过协调过滤技术产生推荐。实验结果表明,本文提出的方案是可行的和有效的,也为创新数字图书馆个性化服务提供了一种新的思路。  相似文献   

17.
FP-Growth是频繁模式挖掘的经典算法,能够在不产生候选集的情况下生成所有的频繁模式,效率与Apriori算法相比有巨大提高,然而FP—Growth算法在挖掘频繁模式过程中需要递归构建大量的条件FP—tree,并分别针对这些条件FP—tree进行挖掘,时间及空间效率不高,在实际应用中存在很大局限性。计算机集群是由多台普通计算机设备通过特定方式结合在一起构成的并行处理系统,属于分布式计算环境,具有计算能力强大、性价比高、灵活等优势。本文提出一种面向计算机集群的并行挖掘算法Gridify FP-Growth,该算法以FP—Growth为基础,通过任务划分的形式,将计算任务分配到计算机集群中各个计算节点上执行,充分利用各个节,最的计算资源,最后汇总各节点的计算结果。实验证明GridifyFP—Growth算法不会牺牲计算的准确性,并可以大幅度缩短计算时间,有效缓解计算大规模数据库时的内存压力。  相似文献   

18.
一个用户在访问一个网站时一般来讲只对该网站的部分内容感性趣,而且这种兴趣会持续一段时间。这点启发了我们,如果能根据用户的喜好为不同的用户显示其个性化的页面,即着重显示该用户感兴趣的内容,将为用户节约大量的检索时间,而且这样的网页显然是更具有吸引力的。本文中数据库服务器端采用了Microsoft Access数据库作为0DBC(Open DataBase Connectivity)数据源,并以先进的ADO(ActiveX Data Objects)技术进行数据库存取等操作,使Web与数据库紧密联系起来。整个个性化页面生成系统主要由使用Dreamweaver_MX开发的关联规则采掘系统和利用IIS+ASP技术实现的个性化Web页面生成器两部分组成。关联规则采掘系统对数据库中的历史记录进行分析,产生用户关联规则表:页面生成器则负责记录用户行为和根据关联规则表动态生成用户个性化Web页面。二者通过数据库服务器和Web服务器连接。  相似文献   

19.
唐红光  周铁军 《民营科技》2007,(1):14-14,83
随着HTML格式的出现,Internet得到了迅猛发展,面对着浩瀚如烟的数据,为了从中发现潜在的、有价值的信息,必须对Web信息进行挖掘;XML语言具有良好的结构,层次性好,用其对Web页面信息进行组织,有利于进行数据挖掘工作。通过对XML及其特点的介绍,提出了一种XML的数据模型,以帮助用户快速、有效的挖掘Web上的信息。  相似文献   

20.
本文主要就基于动态缓存的电子商务平台的优化设计和实现进行了研究。针对电子商务网站的特点和性能要求,在Web服务器前端设置动态缓存服务器,作为Web服务器的前置机,实现动态内容的缓存,加快了响应用户访问的速度;通过一定的替换和更新策略保证用户访问到最新的内容,对提高Web服务器峰值负载下的运行能力,减少访问动态内容的延迟时间起到优化作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号