首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
确定数据集的正确聚类数目是聚类分析中的一个基础性难题。常用的聚类数确定方法通常依赖特定的聚类算法,且在数据集存在子簇群的情况下效果欠佳。本文提出一种新的最佳聚类数确定的指标,该指标着重于分析簇的几何结构,从数据对象分布密度的角度来度量类内紧密度与类间分离度。该指标对噪声不敏感并且可以识别数据集中的子簇群,在实际数据和合成数据上的实验结果表明,新指标的性能优于广泛使用的其他指标。  相似文献   

2.
唐春斌 《物流科技》2006,29(4):47-49
聚类分析是客户关系管理(CRM)中非常重要的工具之一.提出一种新的算法,k-centers,通过重新定义相似度衡量和聚类中心更新方法,能够有效处理混合类型的CRM数据。以解决经典算法比如k-means等只适用于数值类型数据的不足,实验分析说明k-tenters算法能够准确把握不同类型客户的特征,为个性化的市场营销提供有力支持。  相似文献   

3.
基于模糊聚类的客户分类应用研究   总被引:5,自引:0,他引:5  
宋艳  梁静国 《物流科技》2005,28(1):26-28
为解决客户关系管理中的客户分类问题,引入了模糊聚类分析算法。通过分析客户购买力的单因素数据矩阵,以客户胸买力之间相似程度作为聚类指标,应用模糊聚类分析法,求得客户的相对隶属度,从而为客户类别的划分提供科学分类依据。在特征函数确定问题上,提出了结合2/8营销理论的一种新方法。  相似文献   

4.
数据挖掘中聚类分析综述   总被引:1,自引:0,他引:1  
张静 《价值工程》2014,(15):226-227
数据挖掘中的聚类技术是一种非监督分类技术。概述了聚类分析算法中的数据结构和数据类型,分析了聚类分析的意义及研究现状,比较了几种聚类算法的优点及问题,并结合通信领域的应用指出了K-Means聚类技术的绝对优势。  相似文献   

5.
模糊算法的组合运用是数据挖掘的一种重要手段。本文通过运用模糊聚类分析技术,对数据仓库中数据进行模糊划分,得到聚类中心;聚类中心又可作为模糊模式识别的标准模型库,进而对新样本进行模糊模式识别。通过模糊聚类分析和模糊模式识别的组合运用,使数据挖掘系统成为一个自适应的闭环系统。  相似文献   

6.
聚类分析是对多指标(变量)研究对象进行分类的一种多元统计分析方法。聚类分析依据定义的研究对象之间的相近程度(距离或相似系数),将性质相近的对象聚为一类,性质不相近的对象不能聚为一类。  相似文献   

7.
《企业技术开发》2016,(2):55-57
针对模糊C-均值聚类算法不能很好对非椭球形分布,或结构形状不对称分布的数据进行聚类的问题,文章提出了一种基于点密度的模糊C-均值聚类算法PD-FCM,该算法利用数据的点密度能够反映其对不同数据密度分类的符合程度的这一特性,构造了修正参数来改进基于欧几里德距离度量方式,从实现对FCM算法的优化。在人造数据集和知名数据集上的实验结果该算法在准确率和隶属度的准确性方面优于模糊C-均值聚类算法。  相似文献   

8.
本文着重研究了对传统的K-means算法它在银行客户分类方向的应用与实现.首先介绍了数据挖掘的基础理论,然后介绍了聚类分析算法的基础理论,详细介绍了K-means聚类算法,分析了该算法的优缺点,之后定义了银行客户进行聚类.最后,本文按照已经建立的银行客户分类模型,对来自东北某家银行财务部的详细交易数据,进行实际的银行客户聚类实验.最后对聚类结果进行了详细的分析和总结.  相似文献   

9.
选择可比交易实例是土地估价中市场比较法中至关重要的一步,目前人员大多采用定性的方法来进行筛选,怎样提高选择的客观性是一个迫切需要解决的问题,本文引入聚类分析方法,利用模糊聚类技术选出和估价对象最为相似的比较实例。  相似文献   

10.
聚类分析是数据挖掘中很重要的理论和工具,在融合聚类分析技术的基础上,运用模糊聚类提出我国高速公路安全事故原因聚类分析的方法,并利用实际数据进行分析,得出高速公路事故高发的原因的聚类划分,提出预防和控制方案。这是聚类分析在高速公路管理中的一种创新应用,对高速公路管理部门具有一定的参考价值。  相似文献   

11.
基于模糊聚类算法的虚拟物流组织核心能力定量识别   总被引:6,自引:0,他引:6  
汪贻生  王丰  姜大立 《价值工程》2004,23(1):119-122
本文探讨了虚拟物流组织核心能力的概念、含义和特征;对基于模糊聚类算法的核心能力定量识别方法中模糊相似关系矩阵的建立、相似关系系数的确定以及聚类分析等方法进行了改进,并将该方法应用于对虚拟物流组织核心能力的评价和对虚拟物流组织伙伴的选择;最后,结合仿真案例对该方法作了简要分析。  相似文献   

12.
协同过滤算法是目前个性化推荐系统中应用最成功的推荐算法之一。目前协同过滤构建的用户-项目矩阵,一般是按用户对所有项目的评分构建,却没有考虑项目之间的分类情况,导致寻找的邻居集合可能不是最近邻居集合。针对此问题,本文提出基于项目聚类和评分预测的协同过滤推荐算法,该算法首先按商品聚类,将大矩阵按聚类的商品来进行子矩阵的计算,在子矩阵里进行兴趣度的测量,最后将在所有区域相似用户的推荐项目合并,成为该用户的最后推荐结果。实验证明新算法能够提高协同过滤推荐系统的推荐质量。  相似文献   

13.
由于K-means算法的中心点是随机选择的,这样会导致聚类结果很不稳定,同时,孤立点的存在也会影响到聚类的精度,为解决这些问题及二者之间互相牵制,文章基于DCK值来对初始聚类中心进行选择,同时去除数据中的孤立点,使得聚类中心相对稳定,再利用改进的k-means算法对数据进行聚类,改进后的算法较原始算法更准确。  相似文献   

14.
陈蓉 《价值工程》2022,41(1):174-176
为解决电力行业海量非结构化数据导致审计疑点数据效率、准确性低的难题,本文提出了一种基于迭代IK-MD-SA聚类电力大数据审计疑点算法。首先运用相异性度量算法通过构造相异性矩阵和计算均值相异性改进K-means聚类算法选择初始聚类中心,并将簇均值替换为簇中位数完成后续聚类中心迭代,以消离群点影响聚类结果的准确性。然后利用改进的蜂群算法对聚类结果进行优化,使其保证高运行效率的前提下聚类结果仍具有较高准确性。最后,通过离散性电力数据进行识别潜在疑点试验,验证了所提算法的可行性和有效性。  相似文献   

15.
本文选取了江苏省各市的衡量经济发展水平的十五个指标数据,用R软件对所收集到的数据做主成分分析和聚类分析。首先对收集的数据做主成分分析,然后用层次聚类法对标准化的数据作初步的聚类,得到所需要聚类的类数。然后依据层次聚类法确定的类,对江苏省13个市进行类的划分,进而得到江苏省各区域经济发展的差异和特点,为缩小江苏省区域经济的差异提供参考和建议。  相似文献   

16.
通过使用聚类算法对网络IP包进行实验,发现利用此方法可以从众多网络连接中挖掘出潜在的数据相关性:能够从海量的脱机报文中找出“相似”的数据类,从而可以较好的发现不同类型的网络访问,“区分”出具有显著差异的正常连接和异常连接。  相似文献   

17.
本文提出模糊分级聚类分析的方法,并阐述了实现分级聚类的技术措施.此方法能综合不同权重的多套多指标的模糊数据,将样本按预期的类别数进行聚类。一、引言随着国民经济管理决策的科学化和系统化,对众多的研究对象进行分级和聚类的要求愈来愈显得迫切而细致。例如要对某省的128个县进行分级的聚类,依据的指标可能有几十个,每个指标有各自的权重,每位专家可以把每个县按指标归入富裕县、较富裕  相似文献   

18.
本文以建筑施工过程中的安全风险为研究对象,将聚类方法引入风险评价过程中。本文主要分析了高处坠落、坍塌、物体打击、起重伤害、机械伤害等九大风险因素,介绍了K-means聚类方法的原理,收集了住建部的施工伤害数据,通过KNIME软件进行聚类分析,得出各个风险因素的风险类别。最后针对各个风险类别的因素提出风险控制的具体措施。  相似文献   

19.
由于K-means聚类算法具有很强的非凸性,其聚类效果常常取决于初始化结果。近期,Xie等人为了克服初始化问题,将K-means模型松弛为具有非凸约束的优化问题,同时应用近端交替线性化极小化算法求解该类优化问题,但该类算法中的梯度计算复杂度较高。所以,在此基础上,将K-means模型进行了更新,得到了一种改进的PALM聚类算法;通过6个基准数据对新算法聚类结果的评估,实验结果表明:改进的算法的时间复杂度低于原来的算法,且部分数据集解的聚类精度更高。  相似文献   

20.
孙玮  莫蓉  乔虎 《价值工程》2011,30(17):35-36
本文针对半挂罐车等特种车辆,分析了该类产品的相似特征,利用实例与规则集成的快速配置方法,先通过加权欧氏距离的聚类算法来求解历史实例和目标产品间的相似度,提取快速配置过程中所需的相似历史实例,进而采用知识库和规则库对所得实例进行优化,从而满足订单要求,实现基于历史相似实例的板构件产品配置方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号