首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
罗荣秀 《特区经济》2024,(1):123-127
企业融资约束指数的构建方法一般采用两步法,一是判断企业是否存在融资约束,二是通过财务指标构建融资约束指数。本文运用机器学习的方法探讨企业的融资约束指数的构建,首先,判断企业是否存在融资约束,采用聚类算法(K均值聚类和系统聚类)对这些企业进行分类,然后在聚类的基础上,采用分类算法(决策树、逻辑回归、神经网络)探讨企业融资约束的影响特征。本文通过分类算法预测结果,得到决策树算法的准确率是最好的,逻辑回归模型预测的稳定性是最好的,而神经网络预测模型较差。采用逻辑回归模型预测的融资约束概率与SA指数和祝学文的LFC融资约束指数较为密切相关。从企业融资约束的重要特征来看,在聚类的预分类中,重要特征变量为利息保障倍数和股利支付率,在分类算法中,重要特征变量为财务费用率和净资产报酬率。  相似文献   

2.
近年来,P2P网络借贷中借款人违约风险的识别问题被各互联网金融机构重点关注。文章以"人人贷"平台中的借贷数据为样本,运用CART决策树、支持向量机(SVM)、BP神经网络和随机森林等4种主流的机器学习算法,进行代价敏感学习,构建了4种违约风险识别模型并进行比较。研究发现,机器学习算法在多维度借贷数据下的违约风险识别中适用性较强,其中树模型的预测效果显著优于其他两种模型,尤以随机森林模型预测效果最佳。  相似文献   

3.
马梦晨 《特区经济》2023,(1):141-144
本文以上市公司信用风险为研究对象,从wind数据库沪交所挂牌的上市公司中选取340所中小企业,从六个方面构建包含28个二级指标的信用风险评价指标体系。参考目前国际上主流评价方法的研究,选择传统统计模型与机器学习方法对中小企业信用风险进行建模分析。结果表明,随机森林对数据进行SMOTE平衡后的测试集预测准确率最高,准确率可达到94.23%。  相似文献   

4.
孙烨珩 《科技和产业》2020,20(12):227-232
针对传统的离职预测算法应用于现实中高维度小样本不平衡数据集时存在准确度低、易过拟合、鲁棒性差等问题,应用梯度增强集成分类器CatBoost算法,进行类别型特征处理,利用BOHB(Bayesian Optimization and Hyperband)寻找最优参数,结合交叉验证对模型分类性能进行评估,建立分类模型并对护士离职情况进行预测。该算法采用高维小样本不平衡特征的上海部分公立医院的护士离职数据集,并与XGBoost、随机森林、支持向量机进行对比。实验结果表明,该算法准确度高,鲁棒性强,能够有效地对护士离职进行预测。  相似文献   

5.
集成学习算法的基本思想是通过组合多个学习器来共同完成对数据集的学习及预测。本文针对数据挖掘领域常见的分类问题,采用集成学习算法能够稳定提升分类器的性能,同时在现有阶段通用Stacking算法框架的基础上,提出一种以随机森林和梯度提升树等算法作为基层算法的多层Stacking集成学习算法。通过在6个UCI数据集上的实验,结果表明改进后的Stacking算法与其他几种集成算法在泛化性能的提升上有较好表现。  相似文献   

6.
科学地对城市环境空气质量进行评价,并进一步加强空气污染的防治,具有重大的现实意义。选取空气质量6个影响因素为解释变量,量化后的空气质量等级为目标变量,利用分类回归决策树算法构建预测模型,得出空气质量评价解释变量与空气质量等级之间的内在映射关系,并分析目标变量与各影响因子间的重要性关系。选取天津市空气质量历史数据进行评价实验,经实验结果证明,评价训练集和测试集的预测准确率分别为97.76%和96.09%,说明该方法确实可行。  相似文献   

7.
刘耘  陆军 《科技和产业》2023,23(16):214-219
对建设工程造价指数的预测能够有效解决建设项目前期投资估算误差较大引起的成本问题。结合实际工程中对造价指数预测模型的需求,以U市发布的2012—2021年建设工程造价指数为例,通过对比不同特征工程方法构建的XGBoost和神经网络两者之间预测误差,选择最优预测模型进行建设工程造价指数模型预测。结果表明,基于树模型特征筛选和均值填充数据集的XGBoost模型,在测试集、训练集、交叉验证误差最低,能够作为建设工程造价指数预测的模型。  相似文献   

8.
陈滢 《科技和产业》2023,23(9):116-121
基于某金融机构的汽车信贷违约数据构建随机森林风险预测模型,用主成分分析法对数据进行降维,利用上采样的方法解决样本不平衡的问题,同时通过综合五折交叉验证法和网格搜索对随机森林模型调参。此外,还与其他机器学习算法的预测结果进行比较。研究表明,相对于其他两种预测模型,随机森林的性能都是最优的,性能较佳。同时,采用随机森林计算特征重要性时发现,个人抵押资产的价值对汽车信贷违约有显著的影响。  相似文献   

9.
《江苏科技信息》2019,(32):44-46
传统的支持向量机分类模型只有在利用大量已标注数据进行训练才能获得较高精度。在现实研究中,实际产生的数据类型种类繁多,有结构数据和非结构数据等,但都有一个共同特点,大多具有多个标签,因此传统分类算法无法直接应用于多标签分类。文章提出一种基于迁移学习的分类算法,引入迁移学习解决训练数据充分的问题,这种方法在目标域数据集被标注比较少的情况下有着明显的优势;同时为了在训练分类模型的过程中找出对分类起关键作用的信息可以引入半监督学习。  相似文献   

10.
邓博 《科技和产业》2023,23(10):151-157
从定性角度通过对数据进行描述性统计分析,给予银行营销策略建议。使用Lasso-Forest、Logistic、决策树及SVM模型分别进行建模分析,结合不平衡数据处理方法SMOTE算法,使用一系列评价指标进行模型效果评估,得到最优模型。所提出的Lasso-Forest组合模型具有比上述其他模型更精确的预测效果,识别准确率达到93%。使用提供的营销策略以及Lasso-Forest模型可以有效降低银行成本,对客户类型进行精确识别并加以针对性营销,以此达到增加银行定期存款储备的目的。  相似文献   

11.
基于机器学习前沿理论,提出一种基于多模型融合Stacking集成学习方式的组合预测方法,以国内某特高含水油田区块中多口水驱产油井历年生产历史数据为试验样本,预测其动态产油量。依据不同算法的训练原理,选取极限梯度提升树算法、长短记忆网络(LSTM)、时域卷积网络(TCN)等作为模型的基学习器,采用多元线性回归作为模型的元学习器。结果表明:融合后的Stacking模型充分发挥了各基学习器的优势,相比单一模型,融合后的Stacking模型预测平均误差较小,预测鲁棒性较好。该模型的提出对融合模型在特高含水油藏开发方面具有重要的应用意义。  相似文献   

12.
在国内,商业银行的数量上百家,商业银行的业务种类层出不穷,银行的客户数据与日俱增,这给银行客户分类带来了很多难题。文章针对银行客户分类问题,在决策树中引入核的概念,提出一种基于决策树的银行客户分类算法。  相似文献   

13.
张倩男 《科技和产业》2023,23(23):121-127
用户评论文本中的主观情感色彩表达了评价者对产品信息的反馈,对其进行有效挖掘意义重大。针对当前用户评论文本信息未能被充分利用的现状,以Vivo手机用户评论数据为研究对象,构建较完备的手机领域情感词典,对用户评论进行情感倾向分析,得到27 223条评论的手机好评度为91.56%,高于HowNet(情感词典)和NTUSD(情感极性词典)85.96%的好评度。基于情感分析的结果,采用K-means算法发现对产品具有相似兴趣特征的用户群体,并采用TextRank算法挖掘用户群体的兴趣特征。最后利用SVM(支持向量机)、决策树、随机森林、K-近邻算法4种机器学习方法建立用户分类预测模型。随机森林模型预测准确率可达99.83%。基于情感分析的结果定位用户群体的方法,为企业有针对性地进行不同客户群体的营销和服务工作提供了新的方向。  相似文献   

14.
<正>一、前言针对房地产经济周期性波动进行预测时,主要使用支持向量机算法设计预测方案,但面对大量数据时容易陷入过拟合情况,使预测结果均方根误差(RMSE)较大。因此,本文提出以随机森林算法为基础的房地产经济周期性波动预测方法。运用主成分分析方法选取合适的指标,定义房地产经济景气指数,描述房地产经济变化情况。根据已实现房地产经济波动率,考虑动态估计误差,建立经济周期性波动率模型。依托于随机森林算法布置多个决策回归树,  相似文献   

15.
文章以互联网金融机构客户信贷数据为基础,使用7种不同的数据挖掘方法建立个人信用评估模型,从预测准确率、模型外推性、第二类错误率、预期错误分类成本4个方面评价模型的综合信用评估能力。评价结果表明,使用分类树和K近邻分类算法建立的个人信用评估模型的综合信用评估能力最高;同时发现使用线性和非线性方法建立的模型各有特点,线性分类模型能够对违约客户进行有效识别,而非线性分类模型的预测精度较高。  相似文献   

16.
中小企业在生产经营过程中,大部分采用传统的主观判断做决策,一旦出现客户信用问题,无法及时完成货款的支付,将会引发不可估量的严重后果。本文从客户信用评级的角度出发,结合Logistic回归分析法和决策树C5.0构建了信用评级模型,通过比对最终为企业提出最优的模型。  相似文献   

17.
科学有效地预测企业净资产收益率对于资本市场评估企业有很好的借鉴意义。文章为探求随机森林算法对净资产收益率的预测能力,以800家上市企业数据为样本,分别采用决策树、随机森林和支持向量回归模型进行对比试验,建立因子分析与随机森林组合模型,结果表明,随机森林对于净资产收益率有更优的预测效果,对资本市场进行企业评估有很好的借鉴和指导意义。  相似文献   

18.
本项目侧重于研究支持向量机在房地产投资项目中的风险预测与分析的应用。支持向量机是基于统计学习理论和结构风险最小原则基础上的新型机器学习技术。通过选取惩罚系数C和核函数,经过模型初步评价的风险能够和最终数据模拟结果相一致,通过对支持向量机的实证研究表明此种算法在风险预测领域具有较好的风险预测能力  相似文献   

19.
本文广泛求证和搜集五十四年来山东省GDP的相关数据,运用统计学和计量经济学原理,从时间序列的定义出发,探索山东省GDP时间序列的平稳性,并结合统计软件EVIEWS运用ABMA建模方法,对山东省GDP时间序列进行识别、估计、诊断和预测后,建立最优计量经济模型进行经济预测,并为各级政府和企业的管理决策提供数量化的建议。  相似文献   

20.
ARIMA模型在福建省GDP预测中的应用   总被引:13,自引:0,他引:13  
本文介绍求和自回归移动平均模型ARIMA(p,d,q)的建模方法及Eviews实现。将ARIMA模型应用于福建省历年GDP数据的分析与预测,得到较为满意的结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号