共查询到20条相似文献,搜索用时 109 毫秒
1.
确定数据集的正确聚类数目是聚类分析中的一个基础性难题。常用的聚类数确定方法通常依赖特定的聚类算法,且在数据集存在子簇群的情况下效果欠佳。本文提出一种新的最佳聚类数确定的指标,该指标着重于分析簇的几何结构,从数据对象分布密度的角度来度量类内紧密度与类间分离度。该指标对噪声不敏感并且可以识别数据集中的子簇群,在实际数据和合成数据上的实验结果表明,新指标的性能优于广泛使用的其他指标。 相似文献
2.
聚类分析是客户关系管理(CRM)中非常重要的工具之一.提出一种新的算法,k-centers,通过重新定义相似度衡量和聚类中心更新方法,能够有效处理混合类型的CRM数据。以解决经典算法比如k-means等只适用于数值类型数据的不足,实验分析说明k-tenters算法能够准确把握不同类型客户的特征,为个性化的市场营销提供有力支持。 相似文献
3.
基于模糊聚类的客户分类应用研究 总被引:5,自引:0,他引:5
为解决客户关系管理中的客户分类问题,引入了模糊聚类分析算法。通过分析客户购买力的单因素数据矩阵,以客户胸买力之间相似程度作为聚类指标,应用模糊聚类分析法,求得客户的相对隶属度,从而为客户类别的划分提供科学分类依据。在特征函数确定问题上,提出了结合2/8营销理论的一种新方法。 相似文献
4.
数据挖掘中聚类分析综述 总被引:1,自引:0,他引:1
数据挖掘中的聚类技术是一种非监督分类技术。概述了聚类分析算法中的数据结构和数据类型,分析了聚类分析的意义及研究现状,比较了几种聚类算法的优点及问题,并结合通信领域的应用指出了K-Means聚类技术的绝对优势。 相似文献
5.
6.
7.
8.
9.
选择可比交易实例是土地估价中市场比较法中至关重要的一步,目前人员大多采用定性的方法来进行筛选,怎样提高选择的客观性是一个迫切需要解决的问题,本文引入聚类分析方法,利用模糊聚类技术选出和估价对象最为相似的比较实例。 相似文献
10.
聚类分析是数据挖掘中很重要的理论和工具,在融合聚类分析技术的基础上,运用模糊聚类提出我国高速公路安全事故原因聚类分析的方法,并利用实际数据进行分析,得出高速公路事故高发的原因的聚类划分,提出预防和控制方案。这是聚类分析在高速公路管理中的一种创新应用,对高速公路管理部门具有一定的参考价值。 相似文献
11.
12.
协同过滤算法是目前个性化推荐系统中应用最成功的推荐算法之一。目前协同过滤构建的用户-项目矩阵,一般是按用户对所有项目的评分构建,却没有考虑项目之间的分类情况,导致寻找的邻居集合可能不是最近邻居集合。针对此问题,本文提出基于项目聚类和评分预测的协同过滤推荐算法,该算法首先按商品聚类,将大矩阵按聚类的商品来进行子矩阵的计算,在子矩阵里进行兴趣度的测量,最后将在所有区域相似用户的推荐项目合并,成为该用户的最后推荐结果。实验证明新算法能够提高协同过滤推荐系统的推荐质量。 相似文献
13.
由于K-means算法的中心点是随机选择的,这样会导致聚类结果很不稳定,同时,孤立点的存在也会影响到聚类的精度,为解决这些问题及二者之间互相牵制,文章基于DCK值来对初始聚类中心进行选择,同时去除数据中的孤立点,使得聚类中心相对稳定,再利用改进的k-means算法对数据进行聚类,改进后的算法较原始算法更准确。 相似文献
14.
为解决电力行业海量非结构化数据导致审计疑点数据效率、准确性低的难题,本文提出了一种基于迭代IK-MD-SA聚类电力大数据审计疑点算法。首先运用相异性度量算法通过构造相异性矩阵和计算均值相异性改进K-means聚类算法选择初始聚类中心,并将簇均值替换为簇中位数完成后续聚类中心迭代,以消离群点影响聚类结果的准确性。然后利用改进的蜂群算法对聚类结果进行优化,使其保证高运行效率的前提下聚类结果仍具有较高准确性。最后,通过离散性电力数据进行识别潜在疑点试验,验证了所提算法的可行性和有效性。 相似文献
15.
16.
通过使用聚类算法对网络IP包进行实验,发现利用此方法可以从众多网络连接中挖掘出潜在的数据相关性:能够从海量的脱机报文中找出“相似”的数据类,从而可以较好的发现不同类型的网络访问,“区分”出具有显著差异的正常连接和异常连接。 相似文献
17.
本文提出模糊分级聚类分析的方法,并阐述了实现分级聚类的技术措施.此方法能综合不同权重的多套多指标的模糊数据,将样本按预期的类别数进行聚类。一、引言随着国民经济管理决策的科学化和系统化,对众多的研究对象进行分级和聚类的要求愈来愈显得迫切而细致。例如要对某省的128个县进行分级的聚类,依据的指标可能有几十个,每个指标有各自的权重,每位专家可以把每个县按指标归入富裕县、较富裕 相似文献
18.
19.
由于K-means聚类算法具有很强的非凸性,其聚类效果常常取决于初始化结果。近期,Xie等人为了克服初始化问题,将K-means模型松弛为具有非凸约束的优化问题,同时应用近端交替线性化极小化算法求解该类优化问题,但该类算法中的梯度计算复杂度较高。所以,在此基础上,将K-means模型进行了更新,得到了一种改进的PALM聚类算法;通过6个基准数据对新算法聚类结果的评估,实验结果表明:改进的算法的时间复杂度低于原来的算法,且部分数据集解的聚类精度更高。 相似文献