首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 265 毫秒
1.
为解决传统信用风险预测模型的非均衡样本识别不足问题,利用过采样方法和机器学习算法,提升信用债违约预测模型的准确率及稳定性。引入盈利能力、现金流量、营运能力、资本结构、偿债能力5类财务指标和非财务指标,运用SMOTE、Borderline SMOTE、ADASYN方法解决样本不均衡问题,通过逻辑回归、支持向量机、随机森林、XGBoost进行风险识别。结论:对于非均衡信用债违约样本,1000次有放回bootstrap重复抽样下ADASYN-RF模型的AUC、Recall优于LR、SVM和RF模型;ADASYN-SVM模型违约样本实际Recall较不使用过采样法提升36.86个百分点。引入可解释性机器学习方法,发现带息债务/全部投入资本、地方财政收入/债务存量、资产负债率等是信用债违约的重要影响因素。  相似文献   

2.
奉静 《科技和产业》2024,24(4):48-55
以创业板股票市场为主要研究对象,基于文本挖掘方法对创业板股票收益率进行预测分析,利用词典法对从东方财富股吧爬取的2021年4月1日至2023年4月1日创业板股票评论的情感倾向进行分类,建立投资者情绪指数,构建基于粒子群算法优化的支持向量机(particle swarm optimization support vector machine, PSO-SVM)模型对收益率进行预测分析。在实证分析阶段,以创业板中流通市值最大的股票——“宁德时代”为代表,利用PSO-SVM模型对其收益率进行预测分析,同时设置一系列对照模型进行对比分析。结果表明:提出的模型预测结果优于其他对照组模型(多元线性回归、随机森林、支持向量机),而引入情绪指数的模型预测效果比未引入情绪指数的模型预测效果更好。  相似文献   

3.
孙烨珩 《科技和产业》2020,20(12):227-232
针对传统的离职预测算法应用于现实中高维度小样本不平衡数据集时存在准确度低、易过拟合、鲁棒性差等问题,应用梯度增强集成分类器CatBoost算法,进行类别型特征处理,利用BOHB(Bayesian Optimization and Hyperband)寻找最优参数,结合交叉验证对模型分类性能进行评估,建立分类模型并对护士离职情况进行预测。该算法采用高维小样本不平衡特征的上海部分公立医院的护士离职数据集,并与XGBoost、随机森林、支持向量机进行对比。实验结果表明,该算法准确度高,鲁棒性强,能够有效地对护士离职进行预测。  相似文献   

4.
科学有效地预测企业净资产收益率对于资本市场评估企业有很好的借鉴意义。文章为探求随机森林算法对净资产收益率的预测能力,以800家上市企业数据为样本,分别采用决策树、随机森林和支持向量回归模型进行对比试验,建立因子分析与随机森林组合模型,结果表明,随机森林对于净资产收益率有更优的预测效果,对资本市场进行企业评估有很好的借鉴和指导意义。  相似文献   

5.
针对静力触探在工程勘察中分层工作量大、对技术人员的经验基础要求较高、需要钻探辅助分析等缺点这一现状,文章通过静探数据建立支持向量机的模型,试图探索一种自动识别土性的方法,方便技术人员进行土层分层。以原始静探数据为基础,静探数据中锥尖阻力、侧摩阻力、摩阻比、差值作为模型的输入属性,土性类别作为输出属性;针对静探数据中不同土性的样本数目不平衡这一问题,将权值系数法加入到支持向量机模型中,并以几何平均准确率作为预测效果好坏的评价指标,建立出适合静探数据土性分类的支持向量机模型。运用这个模型对扬州市某工程勘察部分静力触探数据进行土性分类,整体分类准确率高达90%以上,证明此方法是可行的。  相似文献   

6.
近年来,P2P网络借贷中借款人违约风险的识别问题被各互联网金融机构重点关注。文章以"人人贷"平台中的借贷数据为样本,运用CART决策树、支持向量机(SVM)、BP神经网络和随机森林等4种主流的机器学习算法,进行代价敏感学习,构建了4种违约风险识别模型并进行比较。研究发现,机器学习算法在多维度借贷数据下的违约风险识别中适用性较强,其中树模型的预测效果显著优于其他两种模型,尤以随机森林模型预测效果最佳。  相似文献   

7.
<正>一、前言针对房地产经济周期性波动进行预测时,主要使用支持向量机算法设计预测方案,但面对大量数据时容易陷入过拟合情况,使预测结果均方根误差(RMSE)较大。因此,本文提出以随机森林算法为基础的房地产经济周期性波动预测方法。运用主成分分析方法选取合适的指标,定义房地产经济景气指数,描述房地产经济变化情况。根据已实现房地产经济波动率,考虑动态估计误差,建立经济周期性波动率模型。依托于随机森林算法布置多个决策回归树,  相似文献   

8.
针对斜坡堤越浪量预测方法,分别建立集成神经网络(ensemble neural network,ENN)、随机森林(random for-eset,RF)和支持向量回归机(suppport vector regression,SVR)3种机器学习模型对斜坡堤越浪量进行预测,并利用决定系数R2和均方根误差RMSE来评估模型性能.最后,对3种模型的性能进行分析.结果显示,集成神经网络模型的决定系数R2和均方根误差RM S E分别约为0.96和0.0018,随机森林模型的决定系数R2和均方根误差RMSE分别约为0.97和0.0014,支持向量回归机模型的决定系数R2和均方根误差RMSE分别约为0.94和0.002.对比发现,3种模型的决定系数都达到0.9以上,都具有较高的预测精度,随机森林相比其他两个模型精度更高.  相似文献   

9.
本文针对中国CPI指数的预测问题.首先用主成分分析方法对影响CPI指数的八个指标进行降维处理.然后利用支持向量机技术建立起中国CPI指数的预测模型并对我国实际的CPI指数进行了预测。实证分析结果表明,PCA—SVM模型能够有效地对CPI指数进行短期预测。最后.与单纯的支持向量机模型的预测结果做了对比.对比结果表明.支持向量机和主成分分析相结合的模型应用于CPI预测具有较高的精确度。  相似文献   

10.
基于GA-SVM模型的福建省城镇登记失业率预测   总被引:1,自引:0,他引:1  
宋芳 《科技和产业》2009,9(9):82-85
将支持向量机应用在失业率预测中,采用遗传算法对传统的支持向量机进行改进,并以福建省城镇登记失业率为对象进行仿真和预测,其结果表明,该模型具有较好的学习和泛化能力,为失业率的预测提供了一条新的途径。  相似文献   

11.
陈滢 《科技和产业》2023,23(9):116-121
基于某金融机构的汽车信贷违约数据构建随机森林风险预测模型,用主成分分析法对数据进行降维,利用上采样的方法解决样本不平衡的问题,同时通过综合五折交叉验证法和网格搜索对随机森林模型调参。此外,还与其他机器学习算法的预测结果进行比较。研究表明,相对于其他两种预测模型,随机森林的性能都是最优的,性能较佳。同时,采用随机森林计算特征重要性时发现,个人抵押资产的价值对汽车信贷违约有显著的影响。  相似文献   

12.
基于对小微企业双创基地入驻企业的调查数据,构建出以知识场活性为自变量、新创企业创新绩效为因变量的概念模型,并将资源拼凑作为中介变量来分析。结果表明:知识场活跃度和知识场开放度均对新创企业创新绩效具有正向影响,资源拼凑具有中介作用;定制化服务对资源拼凑与新创企业创新绩效具有正向调节作用。研究结论丰富了“知识场活性→资源拼凑→新创企业创新绩效”这一逻辑主线的研究,对如何提升新创企业创新绩效具有一定的指导意义。  相似文献   

13.
采用引力模型中“单国模式”,利用面板数据研究森林认证对中国林产品出口的影响。实证研究表明,中国对主要出口的24个国家的林产品出口额受到进口国的人口数量、中国与进口国之间的直线距离以及进口国对森林认证的重视程度的综合影响,其中人口数量的增加促进了我林产品出口额的增长,而国与国之间的距离以及进口国对森林认证的重视程度阻碍了中国林产品的出口。  相似文献   

14.
邓博 《科技和产业》2023,23(10):151-157
从定性角度通过对数据进行描述性统计分析,给予银行营销策略建议。使用Lasso-Forest、Logistic、决策树及SVM模型分别进行建模分析,结合不平衡数据处理方法SMOTE算法,使用一系列评价指标进行模型效果评估,得到最优模型。所提出的Lasso-Forest组合模型具有比上述其他模型更精确的预测效果,识别准确率达到93%。使用提供的营销策略以及Lasso-Forest模型可以有效降低银行成本,对客户类型进行精确识别并加以针对性营销,以此达到增加银行定期存款储备的目的。  相似文献   

15.
In the Domesday survey of 1086, information on the inputs and output of most production units in the English economy was carefully collected by questionnaire survey and verified in court. In this paper, Essex estate data are used to assess whether similar production functions describe production for the three major classes of production unit in the economy – king's, ecclesiastical, and lay estates. A data envelopment analysis is undertaken to determine whether production on one class of estate was more efficient than on the others. The evidence suggests that production processes and management performance were similar on the three classes of estate.  相似文献   

16.
Teacher's holding an administrative position (AP) while teaching is common in schools in China. Does it harm the students' academic performance? This paper uses a representative survey of middle school students in China to answer the question. Using a causal identification based on schools with random class assignments, we find that the effect of a headteacher's holding an AP is negative and significant. In contrast, the effect of a subject teacher's holding an AP may be positive. The results are robust to various robustness checks. The heterogeneity analysis shows that the negative effect is driven by 9th grade students and is larger for boys, rural students, those whose parents migrate out to work, and those whose mothers have lower levels of education. Mechanism analysis suggests that head teachers with an AP devote lower levels of teaching effort, measured by time spent on grading and frequency of adopting supplementary teaching tools.  相似文献   

17.
This paper examines the impact of rice value chain participation and social networks on smallholder farmers' market performance outcomes (paddy price, quantity of paddy traded, and net returns), using data from a recent survey of 458 smallholder rice farmers in northern Ghana. We employed a treatment effects model to account for potential selection bias associated with observable and unobservable factors. The empirical results reveal that smallholder farmers' participation in a rice value chain is associated with increased paddy price, quantity traded, and net returns. We also find that value chain participation decisions and market performance are positively and significantly influenced by social networks. The empirical results also suggest that sex, farm size, mobile phone ownership, and access to credit significantly increase paddy prices, quantity traded, and net returns of smallholder rice farmers in the value chain.  相似文献   

18.
刘小军  杨敏 《科技和产业》2019,19(12):81-88
利用2013—2017年的面板数据,构建了三阶段DEA模型,对京津冀地区38家高端装备制造业上市公司的企业绩效进行了实证研究。结果表明:GDP增长率、股权集中度等环境变量在一定程度上限制了公司提升技术效率。消除环境因素和随机误差的干扰后,大部分样本公司的综合技术效率和规模效率下降,纯技术效率上升,大部分样本公司未达到最优状态。根据分析提出相应的政策建议。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号