共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
本文运用大数据分析软件SAS开展了数据挖掘的探索研究工作,挖掘了对人民银行新疆辖区外商投资企业存量权益数据,利用SAS聚类算法对外商投资企业经营状况按照主要指标进行了特征分析,总结出全辖外商投资企业的特征,并针对分类结果提出了相关的监管建议。 相似文献
3.
4.
选取沪深 A股上市的制造业公司财务变量构建信用风险评价体系,在利用因子分析法对其进行维数约简后,采用数据挖掘技术和统计学方法对信用违约概率测度作了有价值的探索.模型包含两个阶段,聚类阶段采用加权模糊C均值聚类(WFCM)算法将样本聚成同质的类,使同簇样本更具代表性;违约测度阶段应用 Logistic回归方法分别对不同组样本进行测度.实证结果表明:在 Logistic 模型中引入 WFCM算法能显著提高预测样本的违约概率测度准确率;对于样本总体与 ST企业而言,其违约预测准确率比 Lo-gistic模型分别提高了10.7%和20%;ROC检验结果也说明 WFCM-Logistic模型具有更强适用性. 相似文献
5.
分组模型是指根据借款人的行为特征分出不同的客群,是信用评分模型开发中的重要一环,可以提升信用评分模型的精度.采用模糊C均值聚类和CART决策树两种方法对全部借款人进行分组,并对分组后的每个客群进行WOE数值转换和逻辑回归信用评分模型的构建,通过对比发现分组后信用评分模型的KS和AUC均有提升,其中模糊C均值聚类作为无监督学习方法也取得较好的模型性能. 相似文献
6.
7.
8.
汽车保险欺诈在全球范围内逐步蔓延,车险欺诈识别越来越受到社会关注。本文针对实际汽车保险索赔数据中样本数量大且不平衡的特点,提出了平衡随机森林和蚁群结合的组合分类器。首先,对高维、不平衡的车险索赔数据集进行特征选择与分类,将随机森林的特征重要性评价得分和数据的统计检验得分作为启发式信息,利用蚁群算法进行智能搜索,把随机森林的分类精度反馈给蚁群进行信息素的实时更新,挖掘出判别车险欺诈的特征组合。然后将基于蚁群优化算法的平衡随机森林模型应用到汽车保险欺诈识别中。研究结果表明:基于蚁群优化随机森林算法的汽车保险欺诈识别模型能够更好地对车险索赔数据进行分类预测,挖掘车险欺诈规律,具有更好的精确度和稳健性。 相似文献
9.
针对K-means在对客户细分时只能针对数值型数据,而不适用于其他类型的数据的缺点和K-means算法在效率上的不足,本文引进信息熵的理论,并将其与改进的K-means混合迭代得到一个新的算法,其时间复杂度小于原有算法,从而能够准确高效地对客户进行细分。 相似文献
10.
基于K-means聚类算法的银行贷款风险管理分析 总被引:1,自引:0,他引:1
本文构建基于K-means聚类算法的贷款风险管理框架。将银行贷款风险测算模型指标体系化,对我国银行中贷款风险的情况进行实地分析和总结,提出了基于K-means聚类算法的贷款风险预测方法。这种方法是将K-means聚类算法与银行贷款风险测算管理结合起来,通过建立六个量化指标,在实践中建立银行贷款风险测算管理实用体系,解决了经济快速发展中的银行贷款量大规模增加带来的风险测算与管理工作繁杂问题,能有效期确保银行贷款的安全。 相似文献
11.
关联分类是数据挖掘中一种新的分类方法,集成了关联规则挖掘和分类的特点,具有较高的分类精度和较强的扩展性.本文针对银行理财产品营销,通过改进CBA算法,引入加权支持度以及加权置信度进行关联规则的挖掘,然后综合考虑这些规则与测试数据之间的最小差异度,并以此作为依据对客户的理财能力进行分类,为银行有效营销理财产品,提高收益,... 相似文献
12.
收入舞弊可进一步分为会计操纵和交易造假两种类型,交易造假型收入舞弊更具隐蔽性,更容易引发审计失败。本文以2010-2022年度55个交易造假型收入舞弊样本为基础,基于专家经验与异常特征聚类分类,首先将交易造假型收入舞弊划分为4种类型和9种具体手法,其次梳理和分析不同类型收入舞弊操纵手法的异常风险特征和应对举措,最后进行总结并提出降低交易造假型收入舞弊审计风险的三点建议。 相似文献
13.
本文构建基于K-means聚类算法的贷款风险管理框架.将银行贷款风险测算模型指标体系化,对我国银行中贷款风险的情况进行实地分析和总结,提出了基于K-means聚类算法的贷款风险预测方法.这种方法是将K-means聚类算法与银行贷款风险测算管理结合起来,通过建立六个量化指标,在实践中建立银行贷款风险测算管理实用体系,解决了经济快速发展中的银行贷款量大规模增加带来的风险测算与管理工作繁杂问题,能有效期确保银行贷款的安全. 相似文献
14.
15.
16.
本文首先对客户细分理论、聚类分析与K-means算法进行了阐述与分析,然后运用实例分析完成了对K-Means聚类算法在电子商务客户细分中应用的研究。通过本文的研究来识别、分析电子商务的客户信息,从客户信息中挖掘出潜在知识,对客户进行分类管理,为电子商务企业了解客户、挖掘潜在客户、实现差异化营销提供有力的帮助,同时为聚类技术在电子商务客户细分中的应用研究提供一些新思路。 相似文献
17.
18.
区域经济发展不平衡一直是我国东中西部发展的老问题,有必要对区域经济作出适当的划分,贯彻因时、因地制宜的原则,对处于不同发展阶段的地区经济采取不同的管理策略和方法。那么,如何从统计年鉴那些浩瀚的经济统计数据中获得较为准确的划分就成了一个难题,尤其是在毫无先验信息的前提下。本文利用基于FCM的模糊聚类算法,以六项宏观经济指标作为划分依据,得出了非常有效的聚类结果,具有很强的实际参考意义。 相似文献
19.
本文研究目的是通过使用金融时间序列聚类方法验证收益率序列相似的公司是否属于同一个行业。由于金融时间序列数据不服从正态分布,不能用线性相关系数来进行相似性度量,因此文中选用几种非线性相关系数来对金融序列相似度进行度量,然后运用PAM、agnes、diana三种聚类方法分别对金融时间序列进行聚类。研究发现:最终聚类结果和初始的行业分类比较吻合,表明同一个行业中的股票收益率相似度很大。 相似文献
20.
聚类分析是数理统计中的一种分析方法,是用数学方法定量地确定样本的亲疏关系,从而客观地进行分类。本文主要以模糊聚类分析在金融机构洗钱风险评估中的应用进行实例研究,对聚类的结果进行了分析,并提出了建议措施。 相似文献