共查询到18条相似文献,搜索用时 265 毫秒
1.
为解决传统信用风险预测模型的非均衡样本识别不足问题,利用过采样方法和机器学习算法,提升信用债违约预测模型的准确率及稳定性。引入盈利能力、现金流量、营运能力、资本结构、偿债能力5类财务指标和非财务指标,运用SMOTE、Borderline SMOTE、ADASYN方法解决样本不均衡问题,通过逻辑回归、支持向量机、随机森林、XGBoost进行风险识别。结论:对于非均衡信用债违约样本,1000次有放回bootstrap重复抽样下ADASYN-RF模型的AUC、Recall优于LR、SVM和RF模型;ADASYN-SVM模型违约样本实际Recall较不使用过采样法提升36.86个百分点。引入可解释性机器学习方法,发现带息债务/全部投入资本、地方财政收入/债务存量、资产负债率等是信用债违约的重要影响因素。 相似文献
2.
以创业板股票市场为主要研究对象,基于文本挖掘方法对创业板股票收益率进行预测分析,利用词典法对从东方财富股吧爬取的2021年4月1日至2023年4月1日创业板股票评论的情感倾向进行分类,建立投资者情绪指数,构建基于粒子群算法优化的支持向量机(particle swarm optimization support vector machine, PSO-SVM)模型对收益率进行预测分析。在实证分析阶段,以创业板中流通市值最大的股票——“宁德时代”为代表,利用PSO-SVM模型对其收益率进行预测分析,同时设置一系列对照模型进行对比分析。结果表明:提出的模型预测结果优于其他对照组模型(多元线性回归、随机森林、支持向量机),而引入情绪指数的模型预测效果比未引入情绪指数的模型预测效果更好。 相似文献
3.
针对传统的离职预测算法应用于现实中高维度小样本不平衡数据集时存在准确度低、易过拟合、鲁棒性差等问题,应用梯度增强集成分类器CatBoost算法,进行类别型特征处理,利用BOHB(Bayesian Optimization and Hyperband)寻找最优参数,结合交叉验证对模型分类性能进行评估,建立分类模型并对护士离职情况进行预测。该算法采用高维小样本不平衡特征的上海部分公立医院的护士离职数据集,并与XGBoost、随机森林、支持向量机进行对比。实验结果表明,该算法准确度高,鲁棒性强,能够有效地对护士离职进行预测。 相似文献
4.
5.
《中国集体经济》2018,(33)
针对静力触探在工程勘察中分层工作量大、对技术人员的经验基础要求较高、需要钻探辅助分析等缺点这一现状,文章通过静探数据建立支持向量机的模型,试图探索一种自动识别土性的方法,方便技术人员进行土层分层。以原始静探数据为基础,静探数据中锥尖阻力、侧摩阻力、摩阻比、差值作为模型的输入属性,土性类别作为输出属性;针对静探数据中不同土性的样本数目不平衡这一问题,将权值系数法加入到支持向量机模型中,并以几何平均准确率作为预测效果好坏的评价指标,建立出适合静探数据土性分类的支持向量机模型。运用这个模型对扬州市某工程勘察部分静力触探数据进行土性分类,整体分类准确率高达90%以上,证明此方法是可行的。 相似文献
6.
7.
<正>一、前言针对房地产经济周期性波动进行预测时,主要使用支持向量机算法设计预测方案,但面对大量数据时容易陷入过拟合情况,使预测结果均方根误差(RMSE)较大。因此,本文提出以随机森林算法为基础的房地产经济周期性波动预测方法。运用主成分分析方法选取合适的指标,定义房地产经济景气指数,描述房地产经济变化情况。根据已实现房地产经济波动率,考虑动态估计误差,建立经济周期性波动率模型。依托于随机森林算法布置多个决策回归树, 相似文献
8.
针对斜坡堤越浪量预测方法,分别建立集成神经网络(ensemble neural network,ENN)、随机森林(random for-eset,RF)和支持向量回归机(suppport vector regression,SVR)3种机器学习模型对斜坡堤越浪量进行预测,并利用决定系数R2和均方根误差RMSE来评估模型性能.最后,对3种模型的性能进行分析.结果显示,集成神经网络模型的决定系数R2和均方根误差RM S E分别约为0.96和0.0018,随机森林模型的决定系数R2和均方根误差RMSE分别约为0.97和0.0014,支持向量回归机模型的决定系数R2和均方根误差RMSE分别约为0.94和0.002.对比发现,3种模型的决定系数都达到0.9以上,都具有较高的预测精度,随机森林相比其他两个模型精度更高. 相似文献
9.
本文针对中国CPI指数的预测问题.首先用主成分分析方法对影响CPI指数的八个指标进行降维处理.然后利用支持向量机技术建立起中国CPI指数的预测模型并对我国实际的CPI指数进行了预测。实证分析结果表明,PCA—SVM模型能够有效地对CPI指数进行短期预测。最后.与单纯的支持向量机模型的预测结果做了对比.对比结果表明.支持向量机和主成分分析相结合的模型应用于CPI预测具有较高的精确度。 相似文献
10.
基于GA-SVM模型的福建省城镇登记失业率预测 总被引:1,自引:0,他引:1
将支持向量机应用在失业率预测中,采用遗传算法对传统的支持向量机进行改进,并以福建省城镇登记失业率为对象进行仿真和预测,其结果表明,该模型具有较好的学习和泛化能力,为失业率的预测提供了一条新的途径。 相似文献
11.
基于某金融机构的汽车信贷违约数据构建随机森林风险预测模型,用主成分分析法对数据进行降维,利用上采样的方法解决样本不平衡的问题,同时通过综合五折交叉验证法和网格搜索对随机森林模型调参。此外,还与其他机器学习算法的预测结果进行比较。研究表明,相对于其他两种预测模型,随机森林的性能都是最优的,性能较佳。同时,采用随机森林计算特征重要性时发现,个人抵押资产的价值对汽车信贷违约有显著的影响。 相似文献
12.
13.
14.
从定性角度通过对数据进行描述性统计分析,给予银行营销策略建议。使用Lasso-Forest、Logistic、决策树及SVM模型分别进行建模分析,结合不平衡数据处理方法SMOTE算法,使用一系列评价指标进行模型效果评估,得到最优模型。所提出的Lasso-Forest组合模型具有比上述其他模型更精确的预测效果,识别准确率达到93%。使用提供的营销策略以及Lasso-Forest模型可以有效降低银行成本,对客户类型进行精确识别并加以针对性营销,以此达到增加银行定期存款储备的目的。 相似文献
15.
John McDonald 《Australian economic history review》2012,52(3):250-269
In the Domesday survey of 1086, information on the inputs and output of most production units in the English economy was carefully collected by questionnaire survey and verified in court. In this paper, Essex estate data are used to assess whether similar production functions describe production for the three major classes of production unit in the economy – king's, ecclesiastical, and lay estates. A data envelopment analysis is undertaken to determine whether production on one class of estate was more efficient than on the others. The evidence suggests that production processes and management performance were similar on the three classes of estate. 相似文献
16.
Teacher's holding an administrative position (AP) while teaching is common in schools in China. Does it harm the students' academic performance? This paper uses a representative survey of middle school students in China to answer the question. Using a causal identification based on schools with random class assignments, we find that the effect of a headteacher's holding an AP is negative and significant. In contrast, the effect of a subject teacher's holding an AP may be positive. The results are robust to various robustness checks. The heterogeneity analysis shows that the negative effect is driven by 9th grade students and is larger for boys, rural students, those whose parents migrate out to work, and those whose mothers have lower levels of education. Mechanism analysis suggests that head teachers with an AP devote lower levels of teaching effort, measured by time spent on grading and frequency of adopting supplementary teaching tools. 相似文献
17.
This paper examines the impact of rice value chain participation and social networks on smallholder farmers' market performance outcomes (paddy price, quantity of paddy traded, and net returns), using data from a recent survey of 458 smallholder rice farmers in northern Ghana. We employed a treatment effects model to account for potential selection bias associated with observable and unobservable factors. The empirical results reveal that smallholder farmers' participation in a rice value chain is associated with increased paddy price, quantity traded, and net returns. We also find that value chain participation decisions and market performance are positively and significantly influenced by social networks. The empirical results also suggest that sex, farm size, mobile phone ownership, and access to credit significantly increase paddy prices, quantity traded, and net returns of smallholder rice farmers in the value chain. 相似文献
18.
利用2013—2017年的面板数据,构建了三阶段DEA模型,对京津冀地区38家高端装备制造业上市公司的企业绩效进行了实证研究。结果表明:GDP增长率、股权集中度等环境变量在一定程度上限制了公司提升技术效率。消除环境因素和随机误差的干扰后,大部分样本公司的综合技术效率和规模效率下降,纯技术效率上升,大部分样本公司未达到最优状态。根据分析提出相应的政策建议。 相似文献