首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 656 毫秒
1.
张晨 《中国物价》2020,(5):71-74
随着经济的快速发展,金融机构面临着借款人信用违约的巨大挑战,国内P2P网贷行业历经多次监管整治后,金融机构越来越重视线上风控问题。针对P2P个人信贷业务中的违约预测问题,本文使用随机森林和Easy Ensemble两种集成学习方法,在公开的Lending Club数据集上进行测试,实验结果显示,随机森林比传统的Logistic回归模型预测准确率更高,Easy Ensemble方法解决类别不平衡问题比传统的欠采样方法更好。本研究为P2P借贷平台提供合适的机器学习模型,以正确评估借款人信用,实现对借款人违约概率的有效估测,对我国P2P网贷平台的违约风险预警具有参考价值。  相似文献   

2.
本文基于某酒店平台的脱敏用户大数据,利用Python编程对源数据进行挖掘和分析,发现在常用机器学习算法中总体准确率最高(88.3%)的随机森林模型(Random Forest, RF),在特征群体中的预测效果存在缺陷,即在测试集中实际流失率为极值与中间值(0%、50%、100%)的流失群体预测性能较好,平均误差率在1%以下;而在其余流失群体(10%~40%以及60%~90%)中预测效果较差,平均误差率高达12.5%以上。通过进一步计算发现,总体预测率稍差的支持向量机(Support Vector Machine, SVM)学习模型在某些细分群体中反而具有更高的预测性能,平均误差率在7%以下。综合两类学习模型在不同群体中的优势,可进一步将总体预测的准确率提高至92.3%。该研究结果对于酒店行业具有非常重要的启发意义。相关企业在构建客户流失预警模型时应根据不同的用户群体使用不同的机器学习方法来提高预测的性能;或结合多种方法构建混合预测模型从而更好地理解消费者行为,进行客户关系管理。  相似文献   

3.
目前,基于机器学习的雷达辐射源识别技术大多以训练集和测试集同分布为假设,当雷达数据库样本不足导致与信号真实分布存在偏差时,传统的分类方法效果不佳。为此,将迁移学习理论引入识别系统,设计了一种基于结构发现与再平衡的雷达辐射源信号识别方法。通过对数据库和待识别辐射源信号样本进行聚类分析发现数据结构信息,通过重采样处理修正其分布差异。将新采样数据输入支持向量机进行训练并对侦收样本进行识别。仿真实验表明,在新训练样本集上学习的模型对测试集的分类性能有了很大的提升。  相似文献   

4.
随着近年来人工智能产业和大数据技术的飞速发展,传统金融行业逐渐向金融科技转型。招商银行信用卡中心提出依靠数据,预测用户是否会购买掌上生活APP优惠券这一实际业务场景。依据这一实际问题,采用了各种机器学习方法,包括逻辑回归、随机森林、Xgboost、LightGBM,对这一问题进行探索。最后采用集成学习方法对最终结果进行融合。本文采用了上述几种算法模型进行预测,对模型原理进行了分析,并在多个评价指标上衡量各个模型的表现,横向对比了不同模型的优缺点,并对造成结果差异的原因进行了总结。  相似文献   

5.
超密集网络(Ultra-dense Network,UDN)作为5G网络架构的关键技术,其切换时延及无效切换等已成为网络发展的巨大挑战。提出了一种基于集成策略的机器学习算法,并结合用户的移动性数据,进行较高精确度的切换预测,减少切换时延及非必要切换等目标。仿真结果表明,采用结合改进机器学习算法的切换策略,不必要切换率降低了40.2%,平均时延降低了28.6%。  相似文献   

6.
为了从用户地理空间分布数据中挖掘用户间关联关系,提出了一种基于谱聚类的关联关系挖掘算法。首先定义了关联度,用以衡量用户之间空间分布的相似性,基于关联度构造相似矩阵,再利用谱聚类方法对用户进行聚类分析,聚类结果表征了用户的关联关系。采用Silhouette指标和聚类准确率来衡量用户关系挖掘质量,同时与传统的K-Means方法进行了比较,通过真实数据集实验,结果表明该算法在实验数据集上能达到90%以上的聚类准确率,证明方法有效、可行。  相似文献   

7.
迁移学习的主要目标是将一个已知环境中学习的知识,迁移到新环境或变化的环境中,以帮助新的学习。本文提出了一种新的迁移知识获取策略,井将其应用于自动文本分类中进行验证,以打破传统机器学习任务对于训练集和测试集要求同一概率分布和特征空间的假设。迁移知识将通过学习一些特征词的语言学信息及统计信息,构成一种统一的表示形式。相关实验在相同的特征空间及不同的特征空间进行,实验表明,迁移学习方法是有效的,在不同的测试环境下均取得了较理想的结果。  相似文献   

8.
基于大数据的深度学习算法越来越完善,然而如何解决训练样本数非常少的情况,是目前神经网络研究领域中一个非常重要且极具挑战的问题。首先,介绍了少样本问题的定义;接着将现有的少样本学习方法分为数据增强、度量学习和元学习三类,分别从方法所用模型、数据集以及相应的实验结果进行分析;最后,总结了现有方法的不足,探讨了未来少样本研究的方向。  相似文献   

9.
微表情是人们处在一些与平时生活环境不同的高强度环境下试图控制和掩饰的情感表现,也是一种不曾意识到的瞬时脸部表情,持续时间短,强度弱。为了提高其准确率,提出了基于Radon变换的微表情识别算法。首先,对数据库中的视频序列进行灰度归一化、尺寸归一化和二维主成分分析法(Two-dimensional Principal Component Analysis,2DPCA)降维预处理,使用光流法对降维后图像提取运动特征;然后使用Radon变换算法对光流图像进行处理,得到对应微表情的特征值和特征图像;最后使用支持向量机进行微表情分类识别。实验结果表明,使用Radon变换后得到的微表情特征图像得到了较好的识别效果,在微表情数据集CASME和CASMEⅡ上识别率分别为81.48%和82.17%,通过与选取的其他方法对比说明了该方法具有更好的识别性能。  相似文献   

10.
针对辐射源目标精确识别需求,结合以深度学习为代表的机器学习理论技术,提出将改进型AlexNet作为特征提取器,实现目标细微特征提取固化,形成智能化识别网络模型。以广播式自动相关监视(ADS-B)信号为实验对象,在机场实地采集了13个目标的ADS-B脉冲信号数据作为辐射源目标个体识别的训练和测试样本,利用AlexNet和改进的AlexNet验证了算法的有效性。结果表明,改进的AlexNet网络训练时间更快,综合识别率达到98.32%.  相似文献   

11.
随着客滚船大型化发展,危险品查堵工作有了更大的挑战.应用深度学习的方法自建滚装车辆车厢扫描图像数据集并设计了图像分类模型代替人工检测滚装车辆车厢扫描图像中的潜在危险品,经过多轮次的训练迭代模型在检测任务上取得了非常高的准确率,论证了在实际应用场景中使用深度学习方法检测客滚船车载危险品的可行性.  相似文献   

12.
针对图像语义分割中目标边界容易混淆、定位不准以及边界不平滑问题,在Deeplab v2 Resnet-101网络的基础上引入提出的逆注意层与像素相似度学习层,构造了一种新的语义分割的网络结构,并设计了注意力层和像素相似度学习层的损失函数。首先,使用Deeplab v2 Resnet-101网络提取图像语义特征;然后,利用提出的逆注意力层修正预测网络的分割结果,同时,利用提出的像素相似度学习层解决边界不够平滑的问题;最后融合两者分割的结果,得到语义分割的结果。在PASCAL-Context上取得了像素准确度76.2%、像素平均准确度59.7%、平均IoU(Intersection over Union)准确度指标49.9%的结果,在PASCAL Person-Part、NYUDv2、MIT ADE20K数据集上分别取得了平均IoU准确度指标69.6%、42.1%、44.38%的结果,与已有的主流方法相比,所提算法能够提升语义分割的精确度,验证了算法的有效性。  相似文献   

13.
缺失值处理方法比较研究   总被引:1,自引:0,他引:1  
胡红晓  谢佳  韩冰 《商场现代化》2007,(15):352-353
在数据收集过程中,由于各种原因可能造成数据集包括有噪声、不完整,甚至不一致的数据。这些问题将严重影响数据挖掘的质量和结果的稳健性,因此,对数据挖掘的对象进行预处理就显得尤为重要。数据的预处理分为数据清洗、数据集成、数据转换和数据消减。缺失值的处理是数据的清洗的第一步。对缺失值的处理有多种方法,本文将主要分析多重插补的方法。  相似文献   

14.
人力资源是企业发展的重要资源,做好员工离职预警工作有助于企业长远发展。本文采用国网青海省电力公司2010—2018年的员工离职数据,分析得出人才流失的主要影响因素,使用支持向量机(SVM)算法进行员工离职预测分析。该预警模型使用部分员工数据作为训练集,其余作为测试集,使用精确度为92.7%的中值高斯核函数型支持向量机(Medium Gaussian SVM)进行预测,模型预测精度符合预期,为电网企业人才流失预警提供了有效的方法。  相似文献   

15.
学习者在慕课平台上的所有学习行为都会以形式多样的数据形式记录下来,这些大量的学习行为数据,为教育研究者进行学习者分析提供了条件。对教育大数据的挖掘可以达到深入了解学习者学习状态和差异的目的,学习分析可视化便于更直观地展现分析结果。Tableau可视化分析软件无须用户编写代码,操作简易、分析灵活,适合非计算机专业的教育研究人员使用。文章利用Tableau软件对Canvas Network开放学习者数据集进行探索和分析,力图多维度展现慕课学习者特征和学习状况,为在线学习者分析研究提供借鉴参考。  相似文献   

16.
随着网络购物、移动支付、社交电商的发展,市场营销过程中产生的数据特征和数据结构出现了翻天覆地的变化,大数据时代已经到来,机器学习也成为更有效的大数据处理方法。机器学习可以帮助构建消费者画像,预测消费者行为,收集消费者评价。然而机器学习应用于市场营销过程中也存在数据质量不高,计算方法选择不当,违反法律和道德的风险等问题。因此企业市场营销实践中需要对机器学习积极探索、谨慎处理。  相似文献   

17.
针对雷达信号时频图像的去噪和增强问题,提出了利用生成对抗网络二次生成时频图像的方法。首先利用时频分析产生雷达信号的时频图像作为原始数据集1;接着利用生成对抗网络对数据集1进行学习之后生成新的数据集2,数据集2相对于数据集1拥有着去噪和增强的效果;最后提取时频图像奇异值特征检验生成的数据集2的有效性。对6种常见的雷达信号的时频图像进行了仿真实验,结果证明了该方法在时频图像去噪和增加样本多样性方面是有效的。  相似文献   

18.
当前我国上市公司信息披露仍存在着许多不规范的现象,个别上市公司在面临财务危机时,粉饰其财务风险,进行财务造假.本文利用上市超过3年的A股共3002家上市公司的财务数据,通过对ST、*ST和10家2019年退市的公司样本分析,根据不同的时间窗口,构建了财务预警因子库,共96个因子.分别采用机器学习中的逻辑斯蒂回归、支持向量机、决策树模型对因子数据进行训练.将数据集分为训练集和测试集,用训练集训练模型,并将模型应用在测试集中进行预测.结果如下:(1)三种模型均有较好的预测能力,其准确率都在94%以上;(2)决策树模型的预测效果最佳,支持向量机模型次之,逻辑斯蒂回归模型的预测效果最差;(3)三种模型都存在将较多的财务预警公司预测为正常公司的情况.本文通过将三种模型进行对比分析,以寻找更加优质的财务预警模型,来更好地帮助企业识别财务风险.  相似文献   

19.
传统测算方法难以精准定价偏远5A级景区土地生态资源价值,如何评估其生态资源资产是推动偏远国家公园可持续发展亟需科学解决的问题。本文利用河南省焦作市修武县308个土地招牌挂样点训练机器学习测算模型,设置学习率为0.001,经过1721轮训练,均方差稳定在35.91。利用机器学习和现行方法分别对29#地价值测算,结果表明:机器学习与成交价之间方差为1.96,现行方法与成交价之间方差为14.44,方差提高12.48,机器学习测算结果与成交价仅相差1.4元/平方米,机器学习测算结果更加理想。相较传统生态资源资产定价方法,机器学习评估方法的研究对我国公园生态资源资产定价体系建设具有一定的现实意义。  相似文献   

20.
针对人脸表情类内差异大、类间相似度高导致识别率低的问题,提出了一种基于角度距离损失与小尺度核网络的表情识别方法。网络基于3×3卷积核,在网络中加入融合空间金字塔注意力的点积残差块,引入Dropblock正则化,并提出了低层特征掩膜化。该模型低层特征具备高层特征的语义信息,而且参数量较少,结构简单有效。训练时,使用提出的基于角度距离损失函数监督神经网络学习,提高了网络的类间特征分离和类内特征聚类的特征判别能力。实验结果表明,该方法在CK+和FER2013数据集上识别准确率分别达到了97.88%和72.81%,具有较强竞争力。此外,消融实验表明所提出的改进方法可提高表情识别率,进一步验证了其有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号