共查询到20条相似文献,搜索用时 15 毫秒
1.
企业融资约束指数的构建方法一般采用两步法,一是判断企业是否存在融资约束,二是通过财务指标构建融资约束指数。本文运用机器学习的方法探讨企业的融资约束指数的构建,首先,判断企业是否存在融资约束,采用聚类算法(K均值聚类和系统聚类)对这些企业进行分类,然后在聚类的基础上,采用分类算法(决策树、逻辑回归、神经网络)探讨企业融资约束的影响特征。本文通过分类算法预测结果,得到决策树算法的准确率是最好的,逻辑回归模型预测的稳定性是最好的,而神经网络预测模型较差。采用逻辑回归模型预测的融资约束概率与SA指数和祝学文的LFC融资约束指数较为密切相关。从企业融资约束的重要特征来看,在聚类的预分类中,重要特征变量为利息保障倍数和股利支付率,在分类算法中,重要特征变量为财务费用率和净资产报酬率。 相似文献
2.
3.
本文以上市公司信用风险为研究对象,从wind数据库沪交所挂牌的上市公司中选取340所中小企业,从六个方面构建包含28个二级指标的信用风险评价指标体系。参考目前国际上主流评价方法的研究,选择传统统计模型与机器学习方法对中小企业信用风险进行建模分析。结果表明,随机森林对数据进行SMOTE平衡后的测试集预测准确率最高,准确率可达到94.23%。 相似文献
4.
针对传统的离职预测算法应用于现实中高维度小样本不平衡数据集时存在准确度低、易过拟合、鲁棒性差等问题,应用梯度增强集成分类器CatBoost算法,进行类别型特征处理,利用BOHB(Bayesian Optimization and Hyperband)寻找最优参数,结合交叉验证对模型分类性能进行评估,建立分类模型并对护士离职情况进行预测。该算法采用高维小样本不平衡特征的上海部分公立医院的护士离职数据集,并与XGBoost、随机森林、支持向量机进行对比。实验结果表明,该算法准确度高,鲁棒性强,能够有效地对护士离职进行预测。 相似文献
5.
6.
7.
对建设工程造价指数的预测能够有效解决建设项目前期投资估算误差较大引起的成本问题。结合实际工程中对造价指数预测模型的需求,以U市发布的2012—2021年建设工程造价指数为例,通过对比不同特征工程方法构建的XGBoost和神经网络两者之间预测误差,选择最优预测模型进行建设工程造价指数模型预测。结果表明,基于树模型特征筛选和均值填充数据集的XGBoost模型,在测试集、训练集、交叉验证误差最低,能够作为建设工程造价指数预测的模型。 相似文献
8.
基于某金融机构的汽车信贷违约数据构建随机森林风险预测模型,用主成分分析法对数据进行降维,利用上采样的方法解决样本不平衡的问题,同时通过综合五折交叉验证法和网格搜索对随机森林模型调参。此外,还与其他机器学习算法的预测结果进行比较。研究表明,相对于其他两种预测模型,随机森林的性能都是最优的,性能较佳。同时,采用随机森林计算特征重要性时发现,个人抵押资产的价值对汽车信贷违约有显著的影响。 相似文献
9.
10.
从定性角度通过对数据进行描述性统计分析,给予银行营销策略建议。使用Lasso-Forest、Logistic、决策树及SVM模型分别进行建模分析,结合不平衡数据处理方法SMOTE算法,使用一系列评价指标进行模型效果评估,得到最优模型。所提出的Lasso-Forest组合模型具有比上述其他模型更精确的预测效果,识别准确率达到93%。使用提供的营销策略以及Lasso-Forest模型可以有效降低银行成本,对客户类型进行精确识别并加以针对性营销,以此达到增加银行定期存款储备的目的。 相似文献
11.
基于机器学习前沿理论,提出一种基于多模型融合Stacking集成学习方式的组合预测方法,以国内某特高含水油田区块中多口水驱产油井历年生产历史数据为试验样本,预测其动态产油量。依据不同算法的训练原理,选取极限梯度提升树算法、长短记忆网络(LSTM)、时域卷积网络(TCN)等作为模型的基学习器,采用多元线性回归作为模型的元学习器。结果表明:融合后的Stacking模型充分发挥了各基学习器的优势,相比单一模型,融合后的Stacking模型预测平均误差较小,预测鲁棒性较好。该模型的提出对融合模型在特高含水油藏开发方面具有重要的应用意义。 相似文献
12.
在国内,商业银行的数量上百家,商业银行的业务种类层出不穷,银行的客户数据与日俱增,这给银行客户分类带来了很多难题。文章针对银行客户分类问题,在决策树中引入核的概念,提出一种基于决策树的银行客户分类算法。 相似文献
13.
用户评论文本中的主观情感色彩表达了评价者对产品信息的反馈,对其进行有效挖掘意义重大。针对当前用户评论文本信息未能被充分利用的现状,以Vivo手机用户评论数据为研究对象,构建较完备的手机领域情感词典,对用户评论进行情感倾向分析,得到27 223条评论的手机好评度为91.56%,高于HowNet(情感词典)和NTUSD(情感极性词典)85.96%的好评度。基于情感分析的结果,采用K-means算法发现对产品具有相似兴趣特征的用户群体,并采用TextRank算法挖掘用户群体的兴趣特征。最后利用SVM(支持向量机)、决策树、随机森林、K-近邻算法4种机器学习方法建立用户分类预测模型。随机森林模型预测准确率可达99.83%。基于情感分析的结果定位用户群体的方法,为企业有针对性地进行不同客户群体的营销和服务工作提供了新的方向。 相似文献
14.
<正>一、前言针对房地产经济周期性波动进行预测时,主要使用支持向量机算法设计预测方案,但面对大量数据时容易陷入过拟合情况,使预测结果均方根误差(RMSE)较大。因此,本文提出以随机森林算法为基础的房地产经济周期性波动预测方法。运用主成分分析方法选取合适的指标,定义房地产经济景气指数,描述房地产经济变化情况。根据已实现房地产经济波动率,考虑动态估计误差,建立经济周期性波动率模型。依托于随机森林算法布置多个决策回归树, 相似文献
15.
16.
17.
18.
本项目侧重于研究支持向量机在房地产投资项目中的风险预测与分析的应用。支持向量机是基于统计学习理论和结构风险最小原则基础上的新型机器学习技术。通过选取惩罚系数C和核函数,经过模型初步评价的风险能够和最终数据模拟结果相一致,通过对支持向量机的实证研究表明此种算法在风险预测领域具有较好的风险预测能力 相似文献
19.
本文广泛求证和搜集五十四年来山东省GDP的相关数据,运用统计学和计量经济学原理,从时间序列的定义出发,探索山东省GDP时间序列的平稳性,并结合统计软件EVIEWS运用ABMA建模方法,对山东省GDP时间序列进行识别、估计、诊断和预测后,建立最优计量经济模型进行经济预测,并为各级政府和企业的管理决策提供数量化的建议。 相似文献
20.
ARIMA模型在福建省GDP预测中的应用 总被引:13,自引:0,他引:13
本文介绍求和自回归移动平均模型ARIMA(p,d,q)的建模方法及Eviews实现。将ARIMA模型应用于福建省历年GDP数据的分析与预测,得到较为满意的结果。 相似文献