首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
聚类是数据挖掘中的重要研究领域。实现数据挖掘中聚类,有很多种不同的方法,其中基于数学的方法在聚类中发挥着重要的作用。有关聚类的数学方法有:模糊聚类方法、灰色趋势关联聚类、基于区间值的聚类方法。本文分别从方法解决的问题、适用条件、优缺点及其改进方法角度对这几种方法进行了分析和对比,以此体现数学方法对数据挖掘的重要性。  相似文献   

2.
本文对我国上市公司的财务指标进行了综合分析,设置了上市公司财务状况的评价指标体系,选择类平均法和可变平均法,构建了上市公司财务状况的系统聚类分析模型,应用该模型对上市公司财务状况进行了有效的、合理的聚类分析。  相似文献   

3.
文章提出一种概率数据流聚类方法PWStream。PWStream采用直方图保存最近数据信息摘要,在允许的误差范围内删除过期的数据元组;并设计了一种基于距离和存在概率的簇选择策略,从而可以发现更多的强簇。理论分析和实验结果表明,该方法具有良好的聚类质量和较快的数据处理能力。  相似文献   

4.
DBSCAN是一种经典的基于密度聚类算法,能够自动确定簇的数量,对任意形状的簇都能有效处理。但是,在半监督聚类中有些是以成对约束信息作为先验信息来引导聚类过程,而传统的DBSCAN算法并未充分利用这些信息。因此,论文在基于密度的聚类中使用成对约束,对DB-SCAN算法进行改进并最终实现了C-DBSCAN算法。实验表明,该算法有效地提高了聚类的质量。  相似文献   

5.
本文运用模糊聚类分析法,根据供应商的交货可靠度、产品质量和产品价格这三个评价指标对多家供应商进行分析,将供应商大体上分为几类,以便选择出适合企业的供应商。最后用实际算例对本文方法进行了分析说明。  相似文献   

6.
针对传统聚类算法在确定聚类类别数方面所存在的问题:无先验知识所导致的盲目性以及繁杂统计指标的难理解性,提出一种基于SOM的可视化聚类算法.VC-SOM,利用SOM网络数据集的聚簇分布特征.进而确定聚类类别数.并进行了仿真研究,获得了较满意的结果.  相似文献   

7.
利用模糊聚类的方法实现连续性指标值的离散化,对分析对象进行分类以获取指标的粗糙数,应用粗糙集约简方法生成约简的指标集并确定指标属性的权重以对其进行综合评价。这种新的评价方法将RS和模糊聚类有机地融合起来,可以充分发挥两种方法的各自优势。最后通过上市公司业绩评价实例验证了此方法的实用性。  相似文献   

8.
比较购物网站作为一种专业化的垂直搜索引擎,可以对各大购物网站的商品信息进行搜集和整理,方便消费者快速找到性价比高的商品,节省大量的购物时间。论文搜集了目前中国现有的28家比较购物网站,综合考虑各种影响因素,设计了7个评价指标。基于这些指标,用混合分层聚类的方法将比较购物网站聚为三类。由聚类结果可以看出,帮5买是目前我国最大的比较购物网站。最后,指出了目前我国比较购物网站发展过程中存在的一些问题,并针对问题提出相应建议。  相似文献   

9.
基于灰色聚类法的个人信用等级综合评价   总被引:2,自引:0,他引:2  
为了克服传统的信用决策系统过多依赖于专家的主观判断系统的弊端,越来越多的数学方法被引入到了信用评价体系中,本文采用灰色聚类法来进行个人信用评价,根据灰数的白化权函数将个人信用指标或评价对象划分为若干个可定义类别的方法,通过确定了各评价指标的阀值,建立了个人信用指标的白化权函数和评价模型.并通过具体的实例来对该评价方法进行验证.  相似文献   

10.
为分析中小企业信用评级体系指标在等级划分中的相对重要程度,文章以安徽省在深交所中小企业板上市的17家制造业为研究对象,运用SPSS16.0统计分析软件,采用因子分析和两步聚类方法进行分析,结果不仅再次验证不能采用单一指标对企业进行信用评级,而且得出了不同类企业指标的相对重要性,最后对如何提高企业信用等级方面提出建议。  相似文献   

11.
针对k-medoid算法不能有效聚类大数据集和高维数据的弱点,将核学习方法引入到k-medoid算法,提出了基于核的自适应k-medoid算法,使其能够对大数据集和高维数据进行聚类。给出了具体实现过程并将其用于文本分类中,实验表明该算法用于文本分类的有效性及其高效率。  相似文献   

12.
基于混合K-中心点的Web客户聚类   总被引:1,自引:0,他引:1  
通过对Web日志文件进行分析,该文提出了一种改进的K-中心点聚类算法对Wweb用户的行为进行分析的方法。该算法利用模糊相似度,并模仿遗传算法中计算适应度思想,另加了一层循环迭代,每次比较适应度,保留最佳适应度,使之有较好的性能,改进了其易局部最优化的缺点。  相似文献   

13.
本文基于我国31个省份经济发展相关指标的统计数据,运用主成分分析法对各地区的经济发展竞争力及其影响因素进行实证研究,并通过聚类分析对所选取地理单元进行归类。本文认为四大聚类区域经济发展竞争力的主要影响因素分别为政府收支与劳动力就业及教育水平等社会建设指标、资本量及各次产业产值等经济量指标、基础设施建设指标、资源储量指标。在比较各聚类区域经济发展竞争力主要影响因子的基础上,就如何发挥本地比较优势以促进区域协调发展提出相关对策建议。  相似文献   

14.
刘毅 《企业家天地》2011,(5):148-149
对16届世界女子篮球锦标赛各球队的11项技术指标进行统计,并运用因子分析、Q型聚类和等级相关分析法等统计学方法对所得数据进行分析和检验。结果表明:影响第16届世界女子锦标赛各球队成绩的技术数据指标是:得分、进攻篮板、助攻、三分命中率、盖帽和失误6项指标;运用因子分析和Q型聚类对篮球比赛的技战术指标进行量化评价具有较高的可靠性,能够客观的反映各队的技战术能力;本文在揭示16届世界女子篮球锦标赛各球队技战术发展趋势的同时,探索出一种较合理有效的量化评价球队技战术质量的方法。  相似文献   

15.
湖南近些年发展很快,但是各地发展不平衡。本文构建了区域可持续发展评价指标体系,以湖南省14个地级市(州)2007年的指标数据为样本,运用因子分析法对湖南各区域可持续发展水平进行分析、评价,运用系统聚类分析法把湖南省划分为三大类和若干亚类,并提出了提高各地区可持续发展水平,缩小地区差异的建议。  相似文献   

16.
聚类分析是一个正在蓬勃发展的领域,具有非常重要的理论价值和极其广泛的应用领域。作为聚类分析的一个新兴分支,聚类融合已经成为当前数据挖掘和机器学习领域的研究热点之一。本文对聚类融合方法进行了综述,介绍了近几年聚类融合方法研究的主要内容,并讨论了聚类融合方法未来的发展方向。  相似文献   

17.
根据纺织企业生产管理的特点确定其信息化水平评价指标体系,再据此设计调查问卷;选择具有代表性的样本企业进行问卷调查,获得企业信息化的相关数据;根据数据有限且灰度大的特点,运用灰色聚类评估理论建立评价模型;使用MATLAB软件和EXCEL软件计算和处理数据,进行实证分析并据此得出影响企业信息化水平的主要因素,为提高信息化水平提供可靠地决策依据。  相似文献   

18.
本文运用灰色系统理论中的灰色聚类数学模型,对四个金矿床勘探类型进行了划分,取得了比较满意的效果。  相似文献   

19.
提出了一种增量式模糊聚类技术的改进算法,该算法仅对新增数据计算相似系数而直接聚类,其结果和动态聚类算法相同;该算法较好地解决了新增数据的聚类及类属问题,提高了模糊聚类算法的收敛速度,实验结果证实改进了算法的高可靠性。  相似文献   

20.
科技创新在经济快速发展的新时代占有重要地位,研究分析了全国各地区科技创新发展情况,并针对结果提出了有效建议,具有现实意义。基于相关数据,利用主成分分析与有序聚类分析,得出如下结论:(1)原本8个指标变量经过降维处理后,可提取2个主成分,进而根据计算出的主成分综合得分,可以对全国31个省市科技创新发展情况进行排名;(2)对降序后的排名进行有序聚类分析,发现聚类数目为4类,每一类分别代表不同科技创新发展水平的地区。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号