首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 28 毫秒
1.
针对传统聚类算法在确定聚类类别数方面所存在的问题:无先验知识所导致的盲目性以及繁杂统计指标的难理解性,提出一种基于SOM的可视化聚类算法.VC-SOM,利用SOM网络数据集的聚簇分布特征.进而确定聚类类别数.并进行了仿真研究,获得了较满意的结果.  相似文献   

2.
DBSCAN是一种经典的基于密度聚类算法,能够自动确定簇的数量,对任意形状的簇都能有效处理。但是,在半监督聚类中有些是以成对约束信息作为先验信息来引导聚类过程,而传统的DBSCAN算法并未充分利用这些信息。因此,论文在基于密度的聚类中使用成对约束,对DB-SCAN算法进行改进并最终实现了C-DBSCAN算法。实验表明,该算法有效地提高了聚类的质量。  相似文献   

3.
提出了一种增量式模糊聚类技术的改进算法,该算法仅对新增数据计算相似系数而直接聚类,其结果和动态聚类算法相同;该算法较好地解决了新增数据的聚类及类属问题,提高了模糊聚类算法的收敛速度,实验结果证实改进了算法的高可靠性。  相似文献   

4.
聚类是数据挖掘中的重要研究领域。实现数据挖掘中聚类,有很多种不同的方法,其中基于数学的方法在聚类中发挥着重要的作用。有关聚类的数学方法有:模糊聚类方法、灰色趋势关联聚类、基于区间值的聚类方法。本文分别从方法解决的问题、适用条件、优缺点及其改进方法角度对这几种方法进行了分析和对比,以此体现数学方法对数据挖掘的重要性。  相似文献   

5.
对基因表达数据提出模糊聚类的方法,不直接作用于观测数据,而作用于行和列的模糊相关矩阵的等价闭包。利用该方法可有效地将相似的行或列进行聚类。计算结果表明该方法的有效性。  相似文献   

6.
为了准确评价面条品质,文章以46种不同品牌的市售面条为材料,通过实验采集面条样本的力学性能数据和其他属性数据,对构建的数据集进行主成分分析,并借助其结果进行聚类分析,样本最终被划分成5个类,对面条样本进行感官评价。参考感官评价的指标再对每一个簇中的样本进行评价,描述出每个簇中面条样本的品质特性。该方法融合了多种数据分析和评价方法,既具备数据分析的客观性,又不失主观评价的优势。  相似文献   

7.
针对k-medoid算法不能有效聚类大数据集和高维数据的弱点,将核学习方法引入到k-medoid算法,提出了基于核的自适应k-medoid算法,使其能够对大数据集和高维数据进行聚类。给出了具体实现过程并将其用于文本分类中,实验表明该算法用于文本分类的有效性及其高效率。  相似文献   

8.
刘毅 《企业家天地》2011,(5):148-149
对16届世界女子篮球锦标赛各球队的11项技术指标进行统计,并运用因子分析、Q型聚类和等级相关分析法等统计学方法对所得数据进行分析和检验。结果表明:影响第16届世界女子锦标赛各球队成绩的技术数据指标是:得分、进攻篮板、助攻、三分命中率、盖帽和失误6项指标;运用因子分析和Q型聚类对篮球比赛的技战术指标进行量化评价具有较高的可靠性,能够客观的反映各队的技战术能力;本文在揭示16届世界女子篮球锦标赛各球队技战术发展趋势的同时,探索出一种较合理有效的量化评价球队技战术质量的方法。  相似文献   

9.
<正>项目概况:"大数据并行聚类关键技术研究"为国家社会科学基金西部项目,项目负责人洪月华教授(项目编号:15XTQ010),研究时间为2015年6月至2018年12月。项目研究意义:传统的串行聚类算法受限于计算机的CPU、内存等资源,算法执行效率不能满足大数据处理的要求。并行算法是解决这一问题的有效途径。基于已有算法和实现中存在的问题,本项目拟提出在k-means聚类算法上的两种  相似文献   

10.
为探究模糊聚类分析方法在证券投资中是否是一种比传统聚类更有效的指导方法,以16家上市银行为研究对象,分别采用模糊聚类和传统聚类方法对选取的10个重要财务指标进行分析,然后对报告期后三个月各银行股的收盘价按分类结果进行风险和收益分析.结果发现,传统聚类分析中的4种分类方法分类效果欠佳,不能满足特定风险类型投资者的投资要求;而模糊聚类分析的分类结果能满足不同风险偏好投资者的投资要求,减少特定风险类型投资者的选股范围.为获得比较符合客观实际的分类结果和避开在多种传统聚类方法中进行选择,建议投资者采用考虑样本间关联的模糊聚类分析方法对股票进行分析.  相似文献   

11.
2008年金融危机过后,中国企业将很有可能进入另一波海外收购的浪潮。然而以往的失败案例为中国企业开展海外投资敲响了警钟。基于此背景,应用K-means聚类方法,提取国家透明组织2007年CPI(Corruption Perceptions Index)数据和世界银行2007年"良好政府"(good government)数据,运用两次聚类方法,得出了50个存在高政治风险的国家列表。同时采用2007年的FDI对该列表进行了进一步的检验。此列表可供"走出去"的中国企业作为参考。  相似文献   

12.
目前,广泛应用并能简单处理大规模数据集的离群数据挖掘算法主要有基于聚类方法、基于距离方法和基于密度方法等几种;基于离群数据挖掘的计算机审计在操作上一般分为数据的采集、数据的准备、建立离群数据挖掘模型等四个步骤;基于离群数据挖掘方法在审计中的应用,有利于帮助审计人员发现异常的交易或事项,快速确定审计重点,提高审计效率。  相似文献   

13.
为提高流式数据的聚类效果及质量,本文将"云"技术引入了流数据聚类算法中,并在此基础上设计基于云计算的流数据挖掘模型,从而可提高数据的处理速度,增加数据的处理维度,从而可提高流数据处理中内在单元的利用率。结合当前电子信息的发展,拓宽了其应用领域。  相似文献   

14.
聚类分析是一个正在蓬勃发展的领域,具有非常重要的理论价值和极其广泛的应用领域。作为聚类分析的一个新兴分支,聚类融合已经成为当前数据挖掘和机器学习领域的研究热点之一。本文对聚类融合方法进行了综述,介绍了近几年聚类融合方法研究的主要内容,并讨论了聚类融合方法未来的发展方向。  相似文献   

15.
随着企业信息化程度的提高和互联网的普及,每天都会产生海量的实时数据,而数据流挖掘则为分析海量数据提供了一种新途径。数据流挖掘中的聚类、分类、离群点检测等算法的研究取得了进展,为在持续审计中应用数据流挖掘提供了可行性。本文提出的一种基于数据流挖掘的持续审计模型,克服了传统持续审计模型对审计端的存储能力要求高、占用大量硬件资源、联机分析时间长、对异常数据的发现滞后等缺点。  相似文献   

16.
本文使用2007年统计年鉴提供的数据,采用聚类分析方法,分析我国31个省、自治区、直辖市的外商直接投资(FDI)区域分布结构问题.目前有关此问题的研究大量采取回归分析方法进行,而本文取代表主要学说的8个影响变量作为特征变量赋予全国31个省、自治区、直辖市然后通过聚类统计方法来研究.文章首先介绍了聚类分析方法的思路,然后以代表各省、自治区、直辖市发展水平,市场规模,对外依存度,劳动力成本,人力资本,金融效率,基础设施,区位优势的相关数据为研究样本,对各省、自治区、直辖市进行了聚类.聚类的结果表明,第一类4省3市的FDI规模占到全国的71%,而第四类共10省区的FDI规模仅占全国的5%,显示了我国FDI分布结构的极度不平衡.  相似文献   

17.
本文在对矿山环保投资效益研究现状及难度分析的基础上,应用灰色系统理论中的灰色聚类评估模型对某省五个矿山的环保投资效益进行了分析评判,认为灰色聚类评估是研究矿山环保投资效益的一种有效可行的方法。  相似文献   

18.
利用模糊聚类的方法实现连续性指标值的离散化,对分析对象进行分类以获取指标的粗糙数,应用粗糙集约简方法生成约简的指标集并确定指标属性的权重以对其进行综合评价。这种新的评价方法将RS和模糊聚类有机地融合起来,可以充分发挥两种方法的各自优势。最后通过上市公司业绩评价实例验证了此方法的实用性。  相似文献   

19.
簇群是某一特定领域内互相联系的,在地理位置上集中的公司和机构的集合.它具有产业(链)的集中和地理的集聚双重特征.由于簇群内企业的特定关系,簇群也经常被视为一种介于企业与市场之间的中间组织.簇群的出现和发展是一种市场行为,但是一定条件下不规范的市场既有可能促进簇群的形成与发展,也会阻碍簇群的持续演进.发展市场、规范市场是推动簇群持续发展的根本举措.  相似文献   

20.
针对谷物害虫图像识别的特点,可使用基于模糊理论的仓储物害虫图像识别方法。它将禁忌搜索算法(Tabu search)引入其中,以克服模糊C-均值聚类的局部性和对初始聚类中心的敏感性;然后,采用了基于贴近度和择近原则的模糊识别方法,最后,详细设计了上述各算法。仿真结果说明,该方法在识别速度和准确率方面都达到了令人满意的效果,不仅为害虫的在线检测提供了一种新思路,也拓展了模糊理论的应用范围。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号