首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文基于百度指数进行旅游关键词的挖掘,运用决策树、bagging、随机森林和支持向量机四种算法模型对旅游关键词与平遥古城游客流量关系进行分析,并比较了各模型的拟合度、稳定性及预测效果。实证研究发现,随机森林模型稳定性最好,SVM模型拟合和预测效果最好,因此SVM模型可以作为最终的平遥古城客流量预测模型。  相似文献   

2.
杨胜刚  朱琦  成程 《金融论坛》2013,(2):57-61,67
本文以德国某商业银行的真实客户信用数据为样本,将决策树方法应用于个人信用指标的筛选过程中,并与BP神经网络模型相结合构建成一个两阶段组合模型。研究表明,基于决策树—神经网络构建的个人信用评估组合模型对于测试样本的分类预测精度高于单一BP神经网络模型的分类预测精度。组合模型对于测试样本的总正确率平均值为75.45%,高出单一BP神经网络模型的总正确率近3个百分点。基于信息熵增益率分类原理的最优决策树挑选指标方法能合理去除非重要属性指标的干扰,使真正有效的属性指标输入神经网络主模型,提高模型分类预测的精准度。  相似文献   

3.
高送转预案公告发布前,高送转股票具有显著的累计正收益,因此预测高送转股票对于投资具有重要意义。高送转股票的预测是分类预测问题,本文利用上市公司三季度财报数据,采用3种集成学习算法:由K-近邻算法、决策树以及加lasso惩罚项的逻辑斯蒂回归算法构建预测模型——"组合"模型,经典的集成学习算法——Ada Boost算法以及随机森林算法进行建模。本文采用准确率以及G-mean作为模型评价标准,结果显示:"组合"模型的准确率最高,随机森林和"组合"模型的G-mean表现相当,均优于adaboost算法。由于每年高送转股票所占比例小于50%,数据可以看成是非平衡数据,为了改善"组合"模型较差的召回率,本文采用K-Means聚类的欠抽样方法,将此方法用在"组合"模型上,效果显著。最后分别对上面三种模型预测的股票构建投资组合,并以HS300指数做基准。结果显示:"组合"模型预测得到的高送转股票组合表现优于另外两种集成学习模型。  相似文献   

4.
基于决策树的上市公司财务危机预警   总被引:1,自引:0,他引:1  
近年来出现危机的公司越来越多,提前预测财务危机具有重要的意义。目前针对财务危机的研究很多,预警模型也多种多样,本文采用了决策树模型,并将决策树模型预测结果与常用的logistic回归模型的预测结果进行了比较,以验证决策树模型在财务危机预警中的作用。  相似文献   

5.
构建基于RBF神经网络、聚类算法和决策树模型预测结果的集成风险分类模型。实证研究表明该模型预测精度有所提高,性能表现也更加稳健,对于运用于实际洗钱识别工作具有一定的应用价值。  相似文献   

6.
针对个人信用数据不平衡、类间重叠、类型多样性等特点,运用优化的辅助分类器生成对抗网络(ACGAN)、梯度提升决策树(GBDT)分别进行数据过采样、学习与分类,在此基础上构建个人信用风险评估模型。依据金融及大数据相关竞赛平台提供的两个信贷数据集进行实证,从AUC、G mean、Recall等指标出发考量模型的性能。结果显示,模型使用新的过采样技术生成的样本与原始样本非常接近,对违约样本及总样本的识别性能均优于对照模型。  相似文献   

7.
汽车保险欺诈在全球范围内逐步蔓延,车险欺诈识别越来越受到社会关注。本文针对实际汽车保险索赔数据中样本数量大且不平衡的特点,提出了平衡随机森林和蚁群结合的组合分类器。首先,对高维、不平衡的车险索赔数据集进行特征选择与分类,将随机森林的特征重要性评价得分和数据的统计检验得分作为启发式信息,利用蚁群算法进行智能搜索,把随机森林的分类精度反馈给蚁群进行信息素的实时更新,挖掘出判别车险欺诈的特征组合。然后将基于蚁群优化算法的平衡随机森林模型应用到汽车保险欺诈识别中。研究结果表明:基于蚁群优化随机森林算法的汽车保险欺诈识别模型能够更好地对车险索赔数据进行分类预测,挖掘车险欺诈规律,具有更好的精确度和稳健性。  相似文献   

8.
杨子晖  张平淼  林师涵 《金融研究》2022,506(8):152-170
本文采用Logit回归模型以及随机森林模型、梯度提升模型等前沿机器学习方法,深入考察系统性风险指标对我国企业财务危机的预测能力。结果表明,系统性风险对中下游企业的财务危机具有显著的预测能力,而基于因子分析构建的系统性风险指标,结合随机森林模型可取得更好的预测效果。本文进一步区分财务危机的不同成因并发现,基于随机森林模型和Logit回归模型的预测框架能够对我国大多数财务危机事件进行有效预警。在此基础上,本文对我国上市企业监管提出相关建议,从而为完善金融风险处置机制提供一定参考。  相似文献   

9.
随着计算机的普及和电信技术突飞猛进的发展,征信机构的信息产品也随之改进,开发出一些预测类信息产品,以及各种信用管理类软件。目前,我国已有的征信产品和服务与市场潜在需求还有巨大的缺口,征信产品开发和服务创新迫在眉睫。针对现阶段我国征信行业发展过程中征信市场供需不平衡、产品结构单一等问题,本文借鉴国外发达征信机构在征信产品开发上的经验,探索我国征信产品开发及创新的途径。  相似文献   

10.
文章主要通过金融工程当中的量化方法,研究主要宏观经济指标对国内股票市场的影响。文章对主要宏观经济指标序列进行分析筛选,运用统计学中的LOGISTIC回归模型以及数据挖掘的决策树模型,以从2002年5月至2011年12月的月度数据作为样本区间,分别建立用于解释上证综合指数上涨/下跌的LOGISTIC回归模型和决策树模型。在最后,文章对两种模型的结果以及模型局限性进行分析,并且提出后续的研究方向。  相似文献   

11.
机器学习模型由于其对变量间共线性及非线性关系的处理能力,在金融投资领域得到了越来越广泛的应用.利用23个常见因子建立随机森林模型,对中证500指数成分股收益率进行预测并构造投资组合,发现随机森林模型能够对个股的相对收益率进行较好的拟合和预测,多空投资组合的年化收益率和夏普比率分别高达27.31%和1.59;通过因子重要性分析发现,动量因子在随机森林模型中的作用最强,而长期的流动性水平显得最不重要;随机森林模型所代表的非线性因子在估值因子、规模因子和盈利因子上有一定暴露,超额收益极其明显.研究结论有助于促进人工智能和金融学的交叉融合研究,同时也为多因子投资提供了理论和现实参考.  相似文献   

12.
设置查询量阈值是对个人征信异常查询非现场风险监测的有效方法。但当前阈值的设置均以历史最高或平均查询量作为依据,具有定位精度差,误判概率高等缺陷。本文从个人征信查询的起因入手,构建个人信贷相关因素与个人征信查询的数学关系模型,再运用概率模型对预测查询量与实际查询量进行分析,最终得出定量化的风险监测结论。实践表明,将以此方法构建的监测模型应用于个人征信异常查询监测,不仅可行而且高效,对个人征信非现场监管工作有较明显的提升效果。  相似文献   

13.
本文利用大数据网络爬虫技术收集了网贷第三方网站平台的公开数据,利用机器学习模型对网贷平台的非法集资风险进行了预警研究,比较了传统机器学习方法(以逻辑回归和决策树模型为代表)与前沿机器学习模型(以随机森林模型和XGBoost模型为代表)在多个预测指标上的静态预警效能,并在动态预警框架下研究了网贷平台全生命周期内各模型的动态预警效果。研究表明,传统与前沿机器学习模型均表现出了优良的预警效果,传统模型的准确率略低于前沿模型,但决策树模型在重要检出率指标上的表现优于其他模型。在动态预警框架下,本文发现在平台全生命周期内,所采用机器学习模型的预警效果随时间的变化呈现波动上升并在2017年后缓慢下降的趋势。虽然该趋势与我国网贷行业的发展和监管现状相符,但也表明预警模型的使用者应积极寻找表外指标,进一步挖掘网贷平台的深层次指标以稳定预警效果。  相似文献   

14.
选取沪深 A股上市的制造业公司财务变量构建信用风险评价体系,在利用因子分析法对其进行维数约简后,采用数据挖掘技术和统计学方法对信用违约概率测度作了有价值的探索.模型包含两个阶段,聚类阶段采用加权模糊C均值聚类(WFCM)算法将样本聚成同质的类,使同簇样本更具代表性;违约测度阶段应用 Logistic回归方法分别对不同组样本进行测度.实证结果表明:在 Logistic 模型中引入 WFCM算法能显著提高预测样本的违约概率测度准确率;对于样本总体与 ST企业而言,其违约预测准确率比 Lo-gistic模型分别提高了10.7%和20%;ROC检验结果也说明 WFCM-Logistic模型具有更强适用性.  相似文献   

15.
基于决策树的城镇居民生活质量模型——以江苏省为例   总被引:1,自引:0,他引:1  
黄晔 《中国证券期货》2011,(11):161-162
应用决策树方法获取提高城镇居民生活质量的规律性认识。通过对城镇居民的数据样本进行分析挖掘和分类,建立基于居民满意度的决策树分类模型,根据该模型生成规则集,从而发现居民生活质量与主要因素间潜在的规则性知识,为如何提高城镇居民生活满意提供可参考的依据。  相似文献   

16.
卷积神经网络对原始信号特征的提取能力强,调整参数少,能进行并行学习,比其它神经网络决策精度更高。运用卷积神经网络对我国住户贷款余额进行了预测,结果显示,模型的平均预测误差仅为0.7848%,比支持向量机的4.2762%减小了81.4134%,比随机森林的2.9209%减小了72.7892%。提出了利用卷积神经网络对样本外变量发展趋势的预测方法,并运用该方法预测了2022-2026年我国住户贷款规模,通过分析,表明这一预测结果有较高的可信度。  相似文献   

17.
根据中国人民银行菏泽市中心支行小微企业及农村征信数据库建设的试点情况,总结探索基层人民银行在两类征信数梧库建设方面的经验,分析当前两类地方征信数据库建设中存在的问题和制约因素,认为应尽快制定出台两类征信数据库建设工作指导意见,加强两类征信数据库功能建设,以改进和完善两类地方征信数据库.  相似文献   

18.
陈志 《征信》2017,35(5):44-47
根据数据提供者、使用者是否在征信机构中拥有股权、拥有股权的比例等,可将征信机构分为六类。不同的股权安排与市场效率之间关系密切;征信机构的股权结构并不是一成不变的,一些国家征信机构的股权结构一直在调整;从个人征信机构的股权结构来看,我国兼具早期和成熟征信市场的特点,但深入分析,我国征信市场还远未达到成熟的阶段。  相似文献   

19.
当前,美国征信类数字金融服务蓬勃发展,形成了典型的征信类数字化金融服务模式。本文主要分析了我国数字金融发展现状,剖析了美国征信类数字化金融服务模式的典型案例,分析了我国征信类数字化金融服务发展中存在的问题,并就推动我国征信类数字化金融服务业健康发展提出了针对性意见。  相似文献   

20.
为了在接受业务委托、计划审计工作等前期阶段,能够恰当识别由上市公司财务违规带来的审计风险,审计师可选择指标变量、构建预测模型来识别存在违规的上市公司。本文构建了涵盖公司治理、财务状况、经营状况和情感态度的综合指标体系,通过标签建模构造财务违规公司画像,并利用朴素贝叶斯、决策树和随机森林等机器学习算法进行违规识别和预测。结果表明,存在财务违规的公司呈现出审计费用少、股利分配率低、每股收益较小等特征,并在情感态度上存在负面和自我夸大倾向;基于随机森林的预测模型准确率为92.91%,预测效果较好。研究结论表明,通过考虑管理层情感态度、建立可视化画像、应用机器学习预测模型有助于审计师更好地进行审计风险评估。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号