共查询到20条相似文献,搜索用时 46 毫秒
1.
在我国,债券发行人中财务危机企业数量远小于财务健康企业,样本的非平衡性导致一般的财务预警模型在训练时对财务危机企业的特征挖掘不足、预警精度低。利用"聚类Bagging"集成方法,将样本数量较多的财务健康企业样本分成多组,将多组财务健康样本与财务危机样本进行两两配对,形成两类样本大致平衡的多个训练子集。在多个训练子集上分别构建决策树模型作为基学习器,使得决策树基学习器可以大致同等地学习健康样本与危机样本的特征。利用基学习器在测试集上的预测精度AUC值作为权重,对决策树基学习器进行加权,得到决策树集成模型,作为最终的财务预警模型。以制造业债券发行企业为样本,实证对比发现基于决策树集成的财务预警模型精度更高,说明本模型能够在总体预警正确率较高的前提下提高对财务危机企业的正确识别率。 相似文献
2.
3.
4.
5.
针对金融借贷数据存在的较严重的类别不平衡问题,构建基于RUSBoost算法的违约风险预测模型。作为一种集成学习方法,RUSBoost算法利用欠采样实现了训练集的类别均衡,同时又通过对基学习器的独立采样有效克服了因欠采样而造成的信息丢失问题,从而实现了对类别不平衡数据的较强适应能力。基于某网络借贷平台的金融大数据,首次将RUSBoost算法应用于违约风险预测,同时也将随机森林、决策树以及支持向量机等数据挖掘方法分别应用于违约风险预测问题,并与传统的Logistic回归方法和最小二乘模型进行对比分析。从实验结果来看,绝大部分数据挖掘模型的预测性能要明显优于传统模型,而基于RUSBoost算法的违约风险预测模型又明显优于其他数据挖掘模型。 相似文献
6.
为了提高车辆特殊轨迹预测的准确率,采用一种基于长短时记忆网络与贝叶斯优化算法结合的目标车辆轨迹预测方法。利用长短时神经网络进行车辆轨迹预测,并运用贝叶斯优化算法对长短时神经网络进行迭代优化。最后,利用真实数据集以及通过NSGIM(Next Generation Simulation)数据集对模型进行训练和测试,结果表明,基于贝叶斯优化的LSTM车辆轨迹预测方法预测精度于以往方法有所提升。 相似文献
7.
货运量精准预测是多式联运网络高效协同发展的重要基础,货运量时变性强、数据多样性缺失是实现精准货运量预测的问题所在。基于此,通过挖掘货物运输量(集装箱)的时间变化特征,构建初始相关时间特征输入集,结合斯皮尔曼相关性系数分布,采用Bagging+BP集成学习方法训练多个弱分类器,最终组合获取高精度的强学习模型。以南京龙潭港为例,对自回归移动平均模型(ARIMA)、Bagging+BP集成学习网络以及长短时记忆神经网络(LSTM)三种模型进行评价,实验结果表明,相比于其他模型,提出的Bagging+BP集成学习网络预测性能良好,有一定的实用价值。 相似文献
8.
针对传统信用风险评价模型只含有一个分类器的缺陷,本文利用AdaBoost组合分类器来对上市公司信用风险进行评价,并与基于支持向量机和神经网络的分类模型进行了效果比较。实证研究表明,组合分类器克服了单一分类器的诸多缺点,预测准确率高于单一分类器。 相似文献
9.
10.
研究目标:构建动态不平衡财务预警模型以同时处理概念漂移和数据分布不平衡问题。研究方法:在改进AdaBoost算法的基础上,以代价敏感支持向量机为基分类器构建ADA-CSSVM-TW模型,并利用我国2010~2020年制造业公司数据进行分析。研究发现:ADA-CSSVM-TW模型可显著提高预测准确率,性能良好,模型稳健。研究创新:将代价敏感支持向量机作为改进AdaBoost算法的基分类器,建立动态不平衡预警模型。研究价值:对我国上市公司有效防范财务困境具有重要的理论价值和现实意义。 相似文献
11.
本文利用方差选择法和互信息法抽取了财务特征中与债券违约最相关的特征,然后使用SMOTE和Tomek Links结合的方法做样本平衡处理,最后构建基于随机森林算法的债券违约预测模型,并与逻辑回归、决策树构建的模型进行了预测性能上的对比。结果显示,基于随机森林构建的模型相比于逻辑回归、决策树构建的模型,AUC、准确率这两个指标的值都更高,表明该研究在债券违约预测方面具有一定的参考价值。 相似文献
12.
13.
14.
利用动态朴素贝叶斯分类器对我国的通货膨胀风险进行了预测,并在此基础上计算了不同风险因素对通货膨胀风险等级的影响程度,结果表明,动态朴素贝叶斯分类器方法能够较好地预测和分析通货膨胀风险。利用我国实际经济数据进行模拟预测,结果显示在88.24%的可信度下,我国2012年第二季度的通货膨胀风险等级为2级,通货膨胀率预测值约为3.8%。通过分别使用包含和不包含企业家信心指数的动态朴素贝叶斯分类器进行预测,结果发现考虑了企业家信心指数的分类器大约能将预测准确率提高5%,这说明对通货膨胀风险等级预测有必要考虑经济主体的预期因素。通过计算6个指标对通货膨胀风险等级的影响程度,发现货币供应和产出缺口仍是解释我国通货膨胀风险的两个主要因素。 相似文献
15.
使用比赛数据,通过挖掘原始数据并结合背景知识创建了7个特征,使用随机森林和XGBoost模型对特征重要性排名前十五的特征中共同出现的特征进行选取,得到9个特征;然后建立KNN、集成学习类、神经网络等模型,选取三组数据集分别建立模型,最终选取了筛选后的数据集和使用Adam优化器的神经网络作为最终的价格预测模型,其准确率达... 相似文献
16.
"互联网+"背景下,针对如何解决深度挖掘线上供应链金融大数据背后信用风险的问题,提出了一种基于深度信念网络(DBN)的线上供应链金融信用风险评估方法.首先,建立了由受限玻尔兹曼机(RBM)和分类器SOFTMAX构成的深度信念网络评估模型,并利用该模型对三类数据集进行性能评估测试;其次,运用因子分析法从21个指标中甄选8个指标,输入到RBM中进行转换,形成更为科学的评估指标,再将指标输入到SOFTMAX中进行评估;最后,将这种基于DBN的线上供应链金融信用风险评估方法应用到实例中进行了验证.结果表明:该方法的评估准确率达96.04%,与SVM法、Logistic法相比较,具有更高的评估准确率和更好的合理性. 相似文献
17.
18.
本文首先介绍了前人建立的模糊DEA模型,考虑这些模型存在人为提高效率值、未充分利用模糊信息、计算量过大的问题,建立了一个新的L-R DEA模型,该模型基于α-截集的模糊数变换,将指标集分解为多个指标子集,分别对每个子集进行效率计算,最后应用熵值法确定决策单元(DMU)的最终效率值。该方法可以对DMU进行充分排序,扩大了DEA的应用领域。文末通过一算例来说明新模型的有效性。 相似文献