首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
目前存在的基于粗糙集理论的属性约简算法多数只适用于离散型数据。而在现实工作中,不仅有符号、类别等离散型数据,更有大量的连续型或实型数据,甚至二者的混合。传统的离散化过程并不能保存属性在数值上的差异,造成了一定程度的信息损失。本文提出一种将模糊聚类和粗糙集相结合的属性约简算法,从而避免了实型数据的离散化。  相似文献   

2.
本文运用大数据分析软件SAS开展了数据挖掘的探索研究工作,挖掘了对人民银行新疆辖区外商投资企业存量权益数据,利用SAS聚类算法对外商投资企业经营状况按照主要指标进行了特征分析,总结出全辖外商投资企业的特征,并针对分类结果提出了相关的监管建议。  相似文献   

3.
用户-项目评分数据的稀疏性一直是协同过滤推荐算法面临的严峻问题,在统计学视角下提出了改进数据稀疏性的方法,用均值、众数进行用户未评分项目的缺失值替换以及基于K-Means聚类的分类协同推荐,两种方法均在基于用户行为的协同过滤推荐算法上进行实践,通过计算用户间相似性找出最近邻居,根据邻居用户对目标用户未评分项目的评分进行评分预测,并产生推荐。实验证明本文提出的用均值、众数进行缺失值替换方法以及基于K-Means聚类的分类协同推荐方法的推荐结果都要优于传统的协同过滤推荐算法。  相似文献   

4.
选取沪深 A股上市的制造业公司财务变量构建信用风险评价体系,在利用因子分析法对其进行维数约简后,采用数据挖掘技术和统计学方法对信用违约概率测度作了有价值的探索.模型包含两个阶段,聚类阶段采用加权模糊C均值聚类(WFCM)算法将样本聚成同质的类,使同簇样本更具代表性;违约测度阶段应用 Logistic回归方法分别对不同组样本进行测度.实证结果表明:在 Logistic 模型中引入 WFCM算法能显著提高预测样本的违约概率测度准确率;对于样本总体与 ST企业而言,其违约预测准确率比 Lo-gistic模型分别提高了10.7%和20%;ROC检验结果也说明 WFCM-Logistic模型具有更强适用性.  相似文献   

5.
张亚京  赵志冲 《征信》2021,39(12):67-71
分组模型是指根据借款人的行为特征分出不同的客群,是信用评分模型开发中的重要一环,可以提升信用评分模型的精度.采用模糊C均值聚类和CART决策树两种方法对全部借款人进行分组,并对分组后的每个客群进行WOE数值转换和逻辑回归信用评分模型的构建,通过对比发现分组后信用评分模型的KS和AUC均有提升,其中模糊C均值聚类作为无监督学习方法也取得较好的模型性能.  相似文献   

6.
模糊聚类分析在证券投资中的应用   总被引:1,自引:0,他引:1  
基于模糊数学理论,运用模糊聚类分析法研究了证券投资决策问题。首先,在选取6个具有代表性财务指标的基础上,采用模糊聚类分析方法对湖南省上市10只股票的财务指标数据建立模糊相似矩阵,并对其进行模糊聚类分析。然后,通过引进F-统计量以确定最佳l和最优投资股票的分类。实证结果表明,模糊聚类分析为投资者提供了一种有效选股方法,并且模糊聚类分析能够区分不同投资价值的股票。  相似文献   

7.
目前的信用卡信用风险研究主要是如何提高模型的预测准确率。针对银行信用卡数据的异质性和信用数据的高度非线性,本文提出了对持卡人信用风险管理的混合数据挖掘方法。该方法包含两个阶段,在聚类阶段,样本数据被聚成同质的类,删除孤立点,不一致样本点重置标签,使样本更具有代表性;在分类阶段,基于样本进行训练生成支持向量机分类器法,对待分样本分类。基于实际数据进行了数值实验,并根据各类样本的特点提出了相应的风险管理策略。  相似文献   

8.
汽车保险欺诈在全球范围内逐步蔓延,车险欺诈识别越来越受到社会关注。本文针对实际汽车保险索赔数据中样本数量大且不平衡的特点,提出了平衡随机森林和蚁群结合的组合分类器。首先,对高维、不平衡的车险索赔数据集进行特征选择与分类,将随机森林的特征重要性评价得分和数据的统计检验得分作为启发式信息,利用蚁群算法进行智能搜索,把随机森林的分类精度反馈给蚁群进行信息素的实时更新,挖掘出判别车险欺诈的特征组合。然后将基于蚁群优化算法的平衡随机森林模型应用到汽车保险欺诈识别中。研究结果表明:基于蚁群优化随机森林算法的汽车保险欺诈识别模型能够更好地对车险索赔数据进行分类预测,挖掘车险欺诈规律,具有更好的精确度和稳健性。  相似文献   

9.
针对K-means在对客户细分时只能针对数值型数据,而不适用于其他类型的数据的缺点和K-means算法在效率上的不足,本文引进信息熵的理论,并将其与改进的K-means混合迭代得到一个新的算法,其时间复杂度小于原有算法,从而能够准确高效地对客户进行细分。  相似文献   

10.
基于K-means聚类算法的银行贷款风险管理分析   总被引:1,自引:0,他引:1  
本文构建基于K-means聚类算法的贷款风险管理框架。将银行贷款风险测算模型指标体系化,对我国银行中贷款风险的情况进行实地分析和总结,提出了基于K-means聚类算法的贷款风险预测方法。这种方法是将K-means聚类算法与银行贷款风险测算管理结合起来,通过建立六个量化指标,在实践中建立银行贷款风险测算管理实用体系,解决了经济快速发展中的银行贷款量大规模增加带来的风险测算与管理工作繁杂问题,能有效期确保银行贷款的安全。  相似文献   

11.
杨彬  田甜 《金融论坛》2011,(2):57-64
关联分类是数据挖掘中一种新的分类方法,集成了关联规则挖掘和分类的特点,具有较高的分类精度和较强的扩展性.本文针对银行理财产品营销,通过改进CBA算法,引入加权支持度以及加权置信度进行关联规则的挖掘,然后综合考虑这些规则与测试数据之间的最小差异度,并以此作为依据对客户的理财能力进行分类,为银行有效营销理财产品,提高收益,...  相似文献   

12.
收入舞弊可进一步分为会计操纵和交易造假两种类型,交易造假型收入舞弊更具隐蔽性,更容易引发审计失败。本文以2010-2022年度55个交易造假型收入舞弊样本为基础,基于专家经验与异常特征聚类分类,首先将交易造假型收入舞弊划分为4种类型和9种具体手法,其次梳理和分析不同类型收入舞弊操纵手法的异常风险特征和应对举措,最后进行总结并提出降低交易造假型收入舞弊审计风险的三点建议。  相似文献   

13.
本文构建基于K-means聚类算法的贷款风险管理框架.将银行贷款风险测算模型指标体系化,对我国银行中贷款风险的情况进行实地分析和总结,提出了基于K-means聚类算法的贷款风险预测方法.这种方法是将K-means聚类算法与银行贷款风险测算管理结合起来,通过建立六个量化指标,在实践中建立银行贷款风险测算管理实用体系,解决了经济快速发展中的银行贷款量大规模增加带来的风险测算与管理工作繁杂问题,能有效期确保银行贷款的安全.  相似文献   

14.
P2P网贷平台的风险是巨大的,为了更好的研究平台风险,本文分两层进行:首先衡量网贷平台的风险大小;其次评估平台上借款人的信用风险。引入机器学习中的无监督学习算法二分k-means聚类,对网贷平台进行分类,分析各类平台的指标表现,确定各类别的等级,给出网贷平台风险评级结果。进一步使用有监督学习算法对网贷平台的借款人信用风险进行研究,结果显示Ada Boost算法效果最好。  相似文献   

15.
本文首先对客户细分理论、聚类分析与K-means算法进行了阐述与分析,然后运用实例分析完成了对K-Means聚类算法在电子商务客户细分中应用的研究。通过本文的研究来识别、分析电子商务的客户信息,从客户信息中挖掘出潜在知识,对客户进行分类管理,为电子商务企业了解客户、挖掘潜在客户、实现差异化营销提供有力的帮助,同时为聚类技术在电子商务客户细分中的应用研究提供一些新思路。  相似文献   

16.
卢丹丹 《时代金融》2014,(8Z):226-227
本文首先对客户细分理论、聚类分析与K-means算法进行了阐述与分析,然后运用实例分析完成了对K-Means聚类算法在电子商务客户细分中应用的研究。通过本文的研究来识别、分析电子商务的客户信息,从客户信息中挖掘出潜在知识,对客户进行分类管理,为电子商务企业了解客户、挖掘潜在客户、实现差异化营销提供有力的帮助,同时为聚类技术在电子商务客户细分中的应用研究提供一些新思路。  相似文献   

17.
区域经济发展不平衡一直是我国东中西部发展的老问题,有必要对区域经济作出适当的划分,贯彻因时、因地制宜的原则,对处于不同发展阶段的地区经济采取不同的管理策略和方法。那么,如何从统计年鉴那些浩瀚的经济统计数据中获得较为准确的划分就成了一个难题,尤其是在毫无先验信息的前提下。本文利用基于FCM的模糊聚类算法,以六项宏观经济指标作为划分依据,得出了非常有效的聚类结果,具有很强的实际参考意义。  相似文献   

18.
区域经济发展不平衡一直是我国东中西部发展的老问题,有必要对区域经济作出适当的划分,贯彻因时、因地制宜的原则,对处于不同发展阶段的地区经济采取不同的管理策略和方法。那么,如何从统计年鉴那些浩瀚的经济统计数据中获得较为准确的划分就成了一个难题,尤其是在毫无先验信息的前提下。本文利用基于FCM的模糊聚类算法,以六项宏观经济指标作为划分依据,得出了非常有效的聚类结果,具有很强的实际参考意义。  相似文献   

19.
赵冲 《时代金融》2013,(17):56-59
本文研究目的是通过使用金融时间序列聚类方法验证收益率序列相似的公司是否属于同一个行业。由于金融时间序列数据不服从正态分布,不能用线性相关系数来进行相似性度量,因此文中选用几种非线性相关系数来对金融序列相似度进行度量,然后运用PAM、agnes、diana三种聚类方法分别对金融时间序列进行聚类。研究发现:最终聚类结果和初始的行业分类比较吻合,表明同一个行业中的股票收益率相似度很大。  相似文献   

20.
聚类分析是数理统计中的一种分析方法,是用数学方法定量地确定样本的亲疏关系,从而客观地进行分类。本文主要以模糊聚类分析在金融机构洗钱风险评估中的应用进行实例研究,对聚类的结果进行了分析,并提出了建议措施。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号