共查询到20条相似文献,搜索用时 15 毫秒
1.
数据挖掘中聚类分析综述 总被引:1,自引:0,他引:1
数据挖掘中的聚类技术是一种非监督分类技术。概述了聚类分析算法中的数据结构和数据类型,分析了聚类分析的意义及研究现状,比较了几种聚类算法的优点及问题,并结合通信领域的应用指出了K-Means聚类技术的绝对优势。 相似文献
2.
文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文首先对基于空间向量模型的文本聚类过程做了较深入的讨论和总结。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已有成果的基础上,本文利用20Newsgroup文本语料库,针对向量空间表示模型,在开源的数据挖掘平台WEKA上实现了文本预处理和k-means聚类算法,并根据实际聚类效果,就文本表示、特征选择、特征降维等方面提出优化方案。 相似文献
3.
系统聚类法及其应用研究 总被引:3,自引:1,他引:3
《价值工程》2019,(17):254-258
本论文在研究各类系统聚类法的基础上,并运用在实例中说明其方法在具体问题中的应用。即通过最短距离法、最长距离法、中间距离法、类平均法、重心法、离差平法和法等方法对新疆各地州生产总值进行分类,分析并找出分类质量最好的分类结果,提出其方法所体现的优缺点,以及在运用各类系统聚类算法时会存在的弊端等,再对最终研究结果依据相关领域实际情况进行解析,进而提出进一步提高各地州经济发展的对策建议。 相似文献
4.
为解决电力行业海量非结构化数据导致审计疑点数据效率、准确性低的难题,本文提出了一种基于迭代IK-MD-SA聚类电力大数据审计疑点算法。首先运用相异性度量算法通过构造相异性矩阵和计算均值相异性改进K-means聚类算法选择初始聚类中心,并将簇均值替换为簇中位数完成后续聚类中心迭代,以消离群点影响聚类结果的准确性。然后利用改进的蜂群算法对聚类结果进行优化,使其保证高运行效率的前提下聚类结果仍具有较高准确性。最后,通过离散性电力数据进行识别潜在疑点试验,验证了所提算法的可行性和有效性。 相似文献
5.
6.
基于粒子群优化的模糊聚类分析 总被引:1,自引:0,他引:1
基于求解实优化问题时,粒子群优化算法优于遗传算法。在基于遗传算法的模糊C均值聚类算法基础上,给出了基于粒子群的模糊C均值聚类算法,试验结果表明:该算法克服了传统的模糊C均值聚类算法的缺陷,同时在收敛速度方面明显优于基于遗传算法的模糊C均值聚类算法。 相似文献
7.
本文针对DBSCAN算法在计算速度方面的瓶颈,提出了一种新的基于内存的并行DBSCAN算法:合理划分数据库,各个处理器并行聚类,之后合并聚类结果,可以达到很好的聚类结果效果和计算效率。通过对一台双核计算机的实验,发现实验速度可以提高50%左右。 相似文献
8.
本文在现有ABC分析法的基础上,引入货品K-means聚类方法,提出了该方法在仓储管理中的应用框架,使不同类的商品在入库过程中可以进行聚类储存。通过实例证明K-means聚类方法可以结合ABC分析法,提高仓储空间的使用率,该方法在少批量、多品种的电子商务领域的货品储存中有较明显的成效。 相似文献
9.
流程模型聚类是流程管理领域的一个热门话题。本文提出一种基于布谷鸟算法的K-means算法,该算法弥补了K-means算法的依赖初始解、易陷入局部最优等缺点。本文从流程模型结构性能、成本、效率、顾客满意度以及质量等五个方面模拟数据集,并选择权重较高的属性进行试验操作,结果表明算法的具有较高的可行性和有效性。 相似文献
10.
由于K-means算法的中心点是随机选择的,这样会导致聚类结果很不稳定,同时,孤立点的存在也会影响到聚类的精度,为解决这些问题及二者之间互相牵制,文章基于DCK值来对初始聚类中心进行选择,同时去除数据中的孤立点,使得聚类中心相对稳定,再利用改进的k-means算法对数据进行聚类,改进后的算法较原始算法更准确。 相似文献
11.
由于K-means聚类算法具有很强的非凸性,其聚类效果常常取决于初始化结果。近期,Xie等人为了克服初始化问题,将K-means模型松弛为具有非凸约束的优化问题,同时应用近端交替线性化极小化算法求解该类优化问题,但该类算法中的梯度计算复杂度较高。所以,在此基础上,将K-means模型进行了更新,得到了一种改进的PALM聚类算法;通过6个基准数据对新算法聚类结果的评估,实验结果表明:改进的算法的时间复杂度低于原来的算法,且部分数据集解的聚类精度更高。 相似文献
12.
数据挖掘的一个重要研究方向是聚类分析。聚类是指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程。通过聚类使得同一组内的数据对象具有较高的相似度,而不同组中的数据对象相似度较低。本文简单介绍了几种常见的聚类分析算法及这些算法普遍存在的一些问题。 相似文献
13.
本文提出了一种基于独立成分分析的改进k均值时间序列聚类算法,在独立成分分析对每个时间序列提取特征并使用动态时间规整算法对每个时间序列两两进行距离的计算之后,使用模拟退火算法结合k均值聚类算法寻找全局最优解,本文使用伪F统计量确定最优的聚类数目,最后,本文使用实际股票收益时间序列验证了该算法的可行性,得到了较好的结果。 相似文献
14.
《价值工程》2020,(2):250-252
针对目前视频推荐系统功能少、推荐数据不全面,以及采集用户数据不全推荐能力弱,用户体验差等问题,提出了一种基于聚类算法的视频推荐系统算法。通过自主开发的聚类算法中的AP-聚类分层分析所获取到的不同的用户信息,以及不同的用户的视频的关注度信息,形成不同的用户视频信息聚类库,结合用户视频信息库中的历史数据,进行标签设置,自主进行计算权重,利用开发的聚类层进行用户对视频信息的喜好进行排序,生成喜好序列表,最后通过聚类分层模型计算出不同用户在聚类信息库中的喜好视频信息,进行标签和推荐。该算法成功的对不同用户的视频信息进行了标签和推荐,且推荐针对性较强,命中率较高,具有一定的学术研究价值和实际推广意义。 相似文献
15.
基于聚类算法的云平台是当前公有云的主要应用形式。平台整体资源利用率最大化、单虚拟机性能的最优化以及平台的服务接受率是聚类算法的设计目标。抽象出基于聚类算法的交叉环物流服务模型,对物流的服务模式、交叉环物流调度服务器等进行了设计。在此基础上对函数聚类算法各种需求向量的交叉环物流调度进行优化分析,最后在自主研发的云计算平台上验证了可行性。 相似文献
16.
本文主要研究数据挖掘技术在股票市场价格预测中的应用,重点采用数据挖掘分类和聚类算法对大盘走势和个股走势进行分析研究,采用实体数据进行挖掘分析,总结得出有益于投资者的结论。 相似文献
17.
基于聚类算法的云平台是当前公有云的主要应用形式.平台整体资源利用率最大化、单虚拟机性能的最优化以及平台的服务接受率是聚类算法的设计目标.抽象出基于聚类算法的交叉环物流服务模型,对物流的服务模式、交叉环物流调度服务器等进行了设计.在此基础上对函数聚类算法各种需求向量的交叉环物流调度进行优化分析,最后在自主研发的云计算平台上验证了可行性. 相似文献
18.
19.
20.
客户关系管理和数据挖掘都是近几年发展起来的新兴学科,对现代企业的发展有着举足轻重的作用。聚类是数据挖掘中的典型算法,其中的K-均值算法是最基本的算法,由该算法产生了许多经典而高效的算法。文章对数据挖掘成果进行了归纳,深入研究了K-均值算法,并将其运用在客户关系管理的客户分类中,这对研究数据挖掘中的其他算法是很有利的。 相似文献