首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
汽车保险欺诈在全球范围内逐步蔓延,车险欺诈识别越来越受到社会关注。本文针对实际汽车保险索赔数据中样本数量大且不平衡的特点,提出了平衡随机森林和蚁群结合的组合分类器。首先,对高维、不平衡的车险索赔数据集进行特征选择与分类,将随机森林的特征重要性评价得分和数据的统计检验得分作为启发式信息,利用蚁群算法进行智能搜索,把随机森林的分类精度反馈给蚁群进行信息素的实时更新,挖掘出判别车险欺诈的特征组合。然后将基于蚁群优化算法的平衡随机森林模型应用到汽车保险欺诈识别中。研究结果表明:基于蚁群优化随机森林算法的汽车保险欺诈识别模型能够更好地对车险索赔数据进行分类预测,挖掘车险欺诈规律,具有更好的精确度和稳健性。  相似文献   

2.
本文基于商业银行客户信贷记录数据集,通过运用拉普拉斯分层模型对客户的信用风险进行预测研究.利用客户群体存在差异化的特点,采用XGBoost机器学习算法来选择分层特征以及结合多元特征的组合形式来预测客户的违约情况.在不同分层特征结构下依次对比拉普拉斯分层模型、单独模型、共同模型和随机森林四个模型的预测效果,并建立模拟数据集来对拉普拉斯分层模型的性能进行验证.研究发现:(1)拉普拉斯分层模型的预测精度是最高的,预测性能具有稳定性;(2)本文数据集所适用的最佳分层特征是贷款金额、年龄和婚姻;(3)分层特征的选择和数量会依据不同数据而产生相应变化,并非一成不变.结合本文的研究思路和结果,以期为商业银行在客户信用风险评估实践中提供新的思考和建议.  相似文献   

3.
张连增  谢厚谊 《保险研究》2018,1(1):101-111
近20年来广义线性模型在车险定价领域已成为被广泛使用的标准模型。但随着大数据时代的来临,数据记录变得越来越多,可用于车险定价的解释变量个数也变得越来越多,然而变量间的相关关系却通常很强。在这种情形下,亟待寻找新的定价方法,以实现更为精准的车险定价。本文应用机器学习领域中的回归树方法对车险索赔频率进行了预测建模,研究结果表明回归树方法在车险定价领域是广义线性模型很好的辅助与参考。  相似文献   

4.
在互联网金融诈骗产业化、规模化且广泛使用各类前沿技术的背景下,以人工智能等为代表的先进技术为金融机构提高反欺诈能力提供了新的方向。为探索机器学习技术在风险管理中的应用,文章以银行账户数据为研究基础,通过有监督训练,基于LightGBM算法的机器学习模型不断学习数据模式,在完成变量选择的同时择优输出针对欺诈风险的概率预测。  相似文献   

5.
针对贷款违约给商业银行带来的信用风险损失,本文基于Kaggle平台的Loan Defaulter数据集,通过建立机器学习模型预测客户违约情况,以降低信贷风险。本文根据贷款数据类别不平衡和特征维度高的特点,对其进行数据处理以及探索性数据分析,得出与贷款违约高度相关的重要特征,包括性别、家庭人数以及借款人所在城市、住房类型、总收入、所属行业、职业类型、工作年限、受教育程度、消费贷款额度、贷款金额、贷款年金等。在比较各类模型的基础上,本文选择表现较好的随机森林,XGBoost以及K近邻组合为Stacking集成模型。实验表明,与单一算法相比,该模型的集成算法具有更高的精确度和预测效果,其中Stacking模型能够融合其他基础模型的优点,取得最好的预测效果。本文主要创新点有二:一是梳理信用评估模型中集成模型的基本特征,基于不同模型的优势,引入Stacking模型组合建模,融合四组机器学习模型并建立双层学习器,提高了信用风险评估效果;二是基于普惠金融发展,将研究对象具体化为个人信贷,应用场景更加细化,并得出影响贷款违约的重要特征。  相似文献   

6.
随着我国保险业的蓬勃发展,车险领域的保险欺诈问题日益严峻。鉴于我国在机动车辆保险欺诈检测技术方面较为滞后,本文针对车险反欺诈检测方法进行研究,首次将团伙微观建模应用于机动车辆保险欺诈检测。通过引入广义团伙概念,采用基于矩阵的相似度计算、秩排序和变换算法,对极小概率发生但又高度可疑的团伙实现有效识别。相较于传统方法具有更准确和高效的实际应用价值:引入广义团伙对车险欺诈进行全方位识别;将可疑欺诈团伙的车辆碰撞关系映射为人网络关系,从而避免各种人为规避行为对识别和检测的影响;不需要确定的欺诈样本,也不需要进行模型训练就可以直接应用;采用矩阵数值运算完成全部过程,有效提高计算效率。  相似文献   

7.
本文构建了包含1245个变量的宏观经济-微观企业混合大数据集,并结合10种机器学习算法,开展基于大数据和机器学习的债券违约风险预警,探究其背后经济机制。实证结果表明:相比经典Altman模型、Merton模型、信用评级模型,机器学习模型能够更好地预测我国债券市场违约风险,非线性机器学习模型表现更佳。异质性分析表明,机器学习模型对信用评级低、发行期限长、票面利率高、非国有企业、银行间市场的债券,以及在经济政策不确定性(公众基于媒体报道对政府经济政策未来走向的预期的不确定性)高的时期,具有更强的预测能力。机制分析表明,机器学习模型通过违约债券样本识别、短期信号识别(债券交易量)、长期特征识别(融资约束、内部控制)实现精准预测。本文对于债券违约风险预警、维护金融稳定、信用评级体系完善、金融科技创新和金融服务实体经济提供了有益的政策启示。  相似文献   

8.
个体工商户信用评价研究往往通过单一机器学习模型建立,其预测精确率较低,抗干扰能力较弱。基于特征金字塔的FPFF特征融合算法,应用于Blending模型融合框架,建立个体工商户信用评价异质融合模型,并赋予模型可解释性,综合解决单一模型稳定性较差、原有Blending框架融合模型过拟合、融合模型缺乏可解释性的问题。通过对个体工商户数据集进行实证实验,结果表明:融合模型较单一机器学习模型在个体工商户信用评价场景下具有更优的预测性能和泛化能力。  相似文献   

9.
在互联网金融诈骗产业化、规模化,且广泛使用大数据、人工智能等前沿技术的背景下,以人工智能等为代表的先进技术为金融机构提高反欺诈能力提供了新的方向.平安银行借助大数据、云计算、人工智能、知识图谱、IP定位等科技手段搭建了GUARD对公反欺诈体系,通过有监督训练随机森林、XGBoost、SVM及神经网络(ANN)等机器学习模型,不断学习数据模式,在完成变量选择的同时择优输出针对欺诈风险的概率预测.  相似文献   

10.
公司特有风险是企业价值评估特别是收益法评估的重点和难点。本文基于历史实践案例,从A股重大资产重组公开资料中提取可量化数据,并利用特征工程技术对这些数据进行特征筛选和增强,作为输入特征。经网格搜索方法对超参数进行调优后,选取了多个学习器,对前述特征对应的数据进行集中学习,得出特有风险的预测模型。通过实践发现基于递归特征消除算法的特征选择方法能有效提高预测模型的正确率。希望以“特有风险预测”为案例的研究,展示机器学习的操作流程,为评估模型的构建提供新的尝试。  相似文献   

11.
王琼 《甘肃金融》2020,(4):62-66
文章基于切比雪夫正交基神经网络模型,结合数据驱动方法,对中国十年期国债收益率进行预测分析。在模型构建中,选取2018年6月28日到2019年6月28日的十年期国债收益率作为总体数据集,进一步选取总体数据集的前60%数据作为训练样本,生成模型后,预测剩余的40%数据,取得了较优的拟合效果,拟合度达0.9910,为国债收益率预测开拓了新的视野和方向。  相似文献   

12.
车险欺诈的隐蔽性较高,且花样繁多,不易被保险公司察觉,更不易取证。保险公司在这样的情况下要不断吸取经验教训,防止被欺诈。本文以车车险欺诈为研究对象,同时对相关数据采用支持向量机算法进行识别和监控。  相似文献   

13.
非寿险赔款准备金对保险公司的风险管理和财务决策具有重要影响。传统的准备金评估方法通常基于汇总的流量三角形数据进行建模,没有充分利用个体索赔案件的信息,且存在参数过度化、难以处理大额赔款和负增量赔款等问题。本文基于每份保单的个体索赔信息,使用随机森林和XGBoost等机器学习算法对案件的赔付状态、赔付金额分别建立了预测模型,改进了传统准备金评估模型的预测效果。实证研究结果表明,影响赔付状态的因素主要是结案状态、报案延迟等跟案件相关的信息,而影响赔付金额的因素则主要是历史赔付金额等反映出险事故严重程度的信息。本文最后还给出了RBNS准备金的预测分布,其结果更加接近准备金的真实值且方差更小,表明在非寿险RBNS准备金评估中,基于机器学习算法的个体索赔准备金评估模型优于传统的准备金评估模型。  相似文献   

14.
文章基于机器学习与数据挖掘技术构建银行欺诈账户识别模型,通过对比选取了最优的分类器,利用最优分类器筛选出有助于识别欺诈账户的特征变量,并验证了模型的实际应用价值,对如何进一步提升模型识别精度给提出相关建议。  相似文献   

15.
王晓军  路倩 《保险研究》2019,(3):82-102
高龄人口死亡率预测模型是人口预测、养老金成本和债务评估以及长寿风险度量与管理的基础。我国大陆地区高龄人口死亡数据量少、数据波动性大,如何选择适合我国高龄数据特点的死亡率预测模型,是重要的研究课题。本文在归纳总结死亡率预测模型研究进展的基础上,先采用数据较为充分的台湾地区高龄死亡数据,选用Lee-Carter、CBD、贝叶斯分层模型等八种死亡率模型,对模型的拟合效果、预测效果和稳健性做出比较。在此基础上,基于修正和平滑后的我国大陆人口死亡数据,采用CBD模型和贝叶斯分层模型建模和预测。结果显示:贝叶斯分层模型能捕捉我国大陆高龄死亡率数据的历史波动,预测区间能够涵盖全部死亡率的真实值,但预测区间过宽,生存曲线不收敛;相比之下,CBD模型对我国大陆地区高龄死亡率的拟合和预测较好,预测区间和生存曲线合理。在长寿风险度量中,建议采用CBD模型。  相似文献   

16.
科技型中小企业资信风险的变化较一般企业更加频繁。针对这一动态特征,运用卡尔曼滤波方法对其进行资信评估,并构建动态模型。该模型主要在回归分析的基础上,选取预测因子,对违约参数进行估计。经实证分析发现,卡尔曼滤波方法精度较高,稳定性较好,基于该方法所构建的评估模型能根据资信风险变化的动态特征进行有效的资信评估。  相似文献   

17.
本文建立基于粒子群优化(PSO)的支持向量机(SVR),实现对期货价格的有效预测。首先选取代表性的技术指标、收盘价和成交量作为样本特征集,以下一时刻的收盘价作为输出变量。然后通过粒子群优化算法寻找最优的惩罚因子和RBF函数的宽度参数,在此基础上建立支持向量机模型,并用样本集进行训练。最终仿真结果显示基于粒子群算法的支持向量机模型具有学习精度高、泛化能力较强的性质,可用于期货价格的短期预测。  相似文献   

18.
针对P2P网贷平台现金流较大、利润率较低和财务数据获取困难的特点,构建基于平台交易真实数据的危机预警评价指标体系和组合预测模型.将传统的财务评价指标转换成网贷平台交易数据指标,运用邻域粗糙集属性约简的方法对采集的数据指标进行降噪和约减处理,再基于机器学习理论引入神经网络、支持向量机和Logit回归等模型对数据进行训练.通过分组进行单模型和组合模拟预测,提高了新的破产指标下各模型预测的准确率.  相似文献   

19.
基于遗传算法的BP神经网络在权证定价中的应用   总被引:1,自引:0,他引:1  
对金融衍生品的定价一直都是理论界和实务界所关注的热点问题之一.传统的参数模型定价方法,容易产生系统性偏差,而神经网络方法在解决这一问题时具有明显的优势.本文基于遗传算法改进的BP神经网络模型(GABP),利用我国8只权证的1050天数据、标的股票1900天的数据和其他所需数据作为训练数据训练网络.研究结果表明,神经网络在权证的定价中效果要优于B-S模型;而RBF模型精度大于BP模型的预测,GABP模型的精度大于RBF模型的预测.  相似文献   

20.
《金融电子化》2006,(12):105-105
S+Miner是世界排名前三位的著名统计分析与数据挖掘软件厂商InsightfuI公司数据挖掘产品。它是集数据获取、探索性分析、数据操纵、数据清洗、统计分析(集成了著名的S—PLUS统计分析平台的所有分析函数)、机器学习、模型评估和预测发布等功能于一身的新一代数据挖掘工具。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号