首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
在分类应用的过程中,经常会出现新的类别,导致数据分布发生显著变化,使得原分类模型不再适用。如何识别新的类别使分类模型能适应其出现已经成为一个亟需解决的问题。本文提出基于特征增量的SVDD(支持向量数据描述)新类识别方法。该方法在SVDD算法的基础上,通过增加新特征,扩大特征空间维度从而提高模型对于新类的识别能力。在多个数据集上的实验结果表明,该方法能有效识别新类,使更新后的模型具有更高的准确度。  相似文献   

2.
为实时监测车辆行驶状态,建立了基于Canopy-K-means算法的车辆行驶安全特征分类模型.采用Canopy-K-means聚类算法对车辆行驶数据进行挖掘分析,以欧氏距离大小作为数据集属性间的相似性分类指标,得到表征不同行驶安全特征的离线聚类质心;搭建T ruckSim与Simulink联合仿真平台,设置定半径变车速和方向盘斜阶跃输入仿真工况对车辆行驶状态进行在线识别;同时为验证该方法在实车上的应用效果,设置相同工况对离线聚类质心进行验证分析.仿真和实车结果表明:基于Canopy-K-means算法的数据挖掘方法可以对不同行驶状态数据进行分类,得到的表征不同行驶安全特征的聚类质心能在一定程度上对车辆行驶稳定性进行评价,可以作为车辆控制和预警的判定依据.  相似文献   

3.
如何提升电网负荷短期预测水平是电网企业亟待解决的问题。本文针对传统的BP神经网络算法所存在的学习过程收敛速度慢、算法易陷入局部极小点和鲁棒性差等缺陷,引入粒子群优化算法对其进行优化和改进,使之具备更加完善的性能。通过实际电网负荷预测的实验与比较,证明了所构建的符合预测系统的准确度。  相似文献   

4.
李强  陈衍姣 《科技和产业》2022,22(8):271-275
将随机森林应用到商业性养老保险购买行为预测过程中,对中国综合社会调查(CGSS)2017年问卷的调查数据进行分析。首先运用SMOTE过采样来平衡数据集,其次采用网格搜索确认模型输入参数,最后将改进后的随机森林模型进行分类预测,并与支持向量机模型对比。实例结果表明,SMOTE过采样方法在处理非均衡数据方面表现良好,能够起到提高模型性能的效果,处理后的随机森林的分类效果优于支持向量机。  相似文献   

5.
利用模糊系统中的模糊规则和SVM中内积函数之间的关系,通过支持向量机对训练样本进行学习,由支持向量确定模糊规则,构建基于规则的模糊分类器。对人脸图像做独立成分分析,提取有利于分类的面部特征的主要独立成分。该模糊系统在ORL人脸库上的实验结果表明,该方法同样适合解决小样本、非线性、高维模式的分类问题。  相似文献   

6.
大数据时代的来临加深了经济学的研究范式改革,推动社会科学研究由模型驱动向数据驱动转型。本文将机器学习算法引入预测建模,探讨机器学习如何在金融保险领域的风险预测中发挥作用。在经济预测建模中,传统统计回归无法胜任复杂关系的捕捉,而传统的CART决策树容易陷入局部最优而导致预测水平不足的问题。作为一种较新的机器学习方法,进化树是对传统决策树的改进,本文重点对进化树算法的基本原理进行探讨。进化算法应用于树的生成,可以达到全局最优。在经济预测建模应用方面,本文选取机器学习平台OpenML上的两个数据集(Credit和WorkersCompensation),将树方法应用于预测分析:对于Credit数据集,通过构建分类树,探索影响银行客户信用风险发生的可能因素;对于WorkersCompensation数据集,通过构建回归树,对工伤保险赔付进行预测建模,同时探索工伤保险赔付的影响因素。结果发现,进化树算法在保持一定可解释性的同时,能有效提升分类准确率和预测精度。同时,由于树方法会隐性地体现变量之间的交互项和非线性关系,因此进化树模型的构建可补充传统统计回归分析,在经济学的预测问题中具有一定潜力。  相似文献   

7.
河流污染物含量动态预测对污染物的治理具有重要作用,为了提高污染物预测准确度,设计基于BioWin数学模型的河流污染物含量动态预测算法。根据实际径流情况归类当前污染河流相关参数,根据径流特征估算当前河流污染物实际通量,圈定污染物范围,划分河流污染物来源,并分别提出污染物含量的计算方法,实现污染物含量的动态预测。试验数据表明,该预测算法有效提高了预测准确率,具有实际应用优势。  相似文献   

8.
员工的离职一直是困扰企业人员管理的一个难题.离职倾向是预测离职行为的最佳变量.本文对离职倾向的概念和特征进行了总结,从个人和组织两个层面对离职倾向影响因素进行了系统认识,并根据最近的研究成果加入了一些新的影响因素,进而对未来的研究提出一些展望.  相似文献   

9.
集成学习算法的基本思想是通过组合多个学习器来共同完成对数据集的学习及预测。本文针对数据挖掘领域常见的分类问题,采用集成学习算法能够稳定提升分类器的性能,同时在现有阶段通用Stacking算法框架的基础上,提出一种以随机森林和梯度提升树等算法作为基层算法的多层Stacking集成学习算法。通过在6个UCI数据集上的实验,结果表明改进后的Stacking算法与其他几种集成算法在泛化性能的提升上有较好表现。  相似文献   

10.
王静 《西部大开发》2011,(11):9-10,36
我国企业员工离职现象越来普遍,对员工离职问题的研究已成为目前人力资源研究领域的一个热点。员工主动离职对组织的负面影响,以及如何预测和控制主动离职成了企业亟须解决的难题。本文以员工主动离职为对象,选择IT企业销售人员,分析影响员工离职的影响因素。本文在文献研究的基础上,采取访谈,问卷调查的方法,获取第一手收数据,本研究共发放问卷200余份,整理、归纳出5个西安IT销售行业的员工离职意向影响因素,并分析这些影响因素的特殊性、差异性和预测性,为1T销售业员工的离职研究和离职管理提供参考。  相似文献   

11.
罗凤娥  王波  李娜  王洵 《科技和产业》2020,20(11):75-80
针对具有海量数据、高维特征的航班延误预测问题,数据挖掘技术表现出独有的优势。结合数据挖掘理论,以及航班延误预测问题的数据特征,提出延误预测的一般流程;从算法角度切入,结合相关文献对比分析五类经典数据挖掘算法在航班延误预测问题中的应用;针对预测精度和效率问题,讨论算法选择与数据处理在研究过程中的必要性;最后,结合该领域重要讲究方向与热点问题进行研究展望。  相似文献   

12.
This paper provides an example of a model that yields widely divergent estimates when different stock market indexes are used to calculate two independent variables in Romer's [1990] model. Her model sought to explain consumer durable good production before the Great Crash (31 observations). She used the Cowles Commissions Series P Stock Price Index to calculate two independent variables. However, when this paper uses the S&P Index to calculate these variables, its estimates completely contradict Romer's findings. It discovered that one incorrect monthly observation in the S&P Index is responsible for this difference. It also found that robustness techniques serve to limit the impact of the errant observation, illustrating the importance of using robustness techniques in small data sets.  相似文献   

13.
基于机器学习前沿理论,提出一种基于多模型融合Stacking集成学习方式的组合预测方法,以国内某特高含水油田区块中多口水驱产油井历年生产历史数据为试验样本,预测其动态产油量。依据不同算法的训练原理,选取极限梯度提升树算法、长短记忆网络(LSTM)、时域卷积网络(TCN)等作为模型的基学习器,采用多元线性回归作为模型的元学习器。结果表明:融合后的Stacking模型充分发挥了各基学习器的优势,相比单一模型,融合后的Stacking模型预测平均误差较小,预测鲁棒性较好。该模型的提出对融合模型在特高含水油藏开发方面具有重要的应用意义。  相似文献   

14.
为准确预测乘用车使用寿命,提出基于网格搜索优化LightGBM(GS-LGBM)模型的乘用车使用寿命预测方法。通过对2014—2019年乘用车报废数据进行大量实验,并与9种流行的机器学习算法进行对比,结果表明,LightGBM在平均绝对误差(MAE)、中位绝对误差(MEAE)、均方误差(MSE)和拟合优度判定系数(R2)4项指标上均明显优于其他算法。为进一步提升模型预测精度,采用网格搜索算法对LightGBM进行参数优化构建GS-LGBM模型,效果显著提升(MAE降低11.02%),说明该方法能够更准确高效地预测乘用车使用寿命。  相似文献   

15.
鄂嫚迪  卢昌崇 《南方经济》2017,36(3):106-120
文章利用2003年-2012年A股非金融国有上市公司高管的变更数据,分别考察证券分析师预测误差以及同行相对绩效对我国国企高管晋升、平调与降职变更的影响。研究结果证明,分析师预测误差作为来自资本市场的社会监督机制,对我国国企高管的平调与降职有显著的负向影响,即企业绩效高于分析师预测绩效越多,国企高管降职和平调的概率越小,反之亦然。且与较低的同行相对绩效相比,同行相对绩效较高时,证券分析师预测误差对高管降职的负相关关系越强。以上结果在稳健性检验中仍然成立。  相似文献   

16.
高耀龙 《科技和产业》2023,23(8):255-258
矿井涌水量准确预测对于煤矿安全生产具有重要意义。为了进一步提高矿井涌水量预测精度,针对矿井涌水量可用数据少且存在未知影响因素,在灰色马尔科夫预测模型的基础上引入等维新息思想,构建等维新息灰色马尔科夫预测模型。通过分析高河煤矿2008—2017年矿井涌水量原始数据,预测2018和2019年矿井涌水量数据,并对3种预测方法的预测精度进行对比分析。研究结果表明:等维新息马尔科夫预测模型符合矿井涌出量数据特征,引入等维新息思想能够避免旧数据贡献值低的问题,预测精度得到进一步提高;等维新息马尔科夫预测模型的预测精度比灰色理论、马尔科夫预测模型的预测精度平均高3.11%和0.22%,预测值与实际矿井涌水量更加接近,具有较好的适应性。  相似文献   

17.
余涛涛  江柯  高鹏 《科技和产业》2023,23(7):235-240
强降水等恶劣天气对于民航的正常运行有着极大的危害,降水量的准确预测有助于民航等企业安全稳定运行。通过对机场跑道自动气象观测系统(AWOS)收集的降水时序数据进行预处理,为深度学习提供训练和测试的样本集,然后分别构建长短期记忆模型(LSTM)和时序卷积网络(TCN)模型,实现对未来1~3 h降水量的预测,并对两个模型的预测精度进行比较分析。结果表明,TCN模型的预测效果优于LSTM模型。其中,对未来1~3 h降水量的预测中,TCN模型的R2分别为0.96、0.91和0.86。  相似文献   

18.
在煤炭铁路物流需求预测中,存在历史样本量较小和非线性强的特点,从而致使预测精度较低。将支持向量回归机(support vectorreg ression,SVR)与粒子群算法(Particle Swarm Optimization,PSO)相结合,提出适用于小样本量学习的PSO-SVR模型。选取1995-2011年的煤炭铁路货运量及其影响因素作为学习样本,利用粒子群算法对支持向量机参数进行优化,通过训练、测试得到具有良好学习与推广能力的煤炭铁路货运量预测模型。建立BP神经网络模型,并将二者的预测值进行对比,结果表明在解决我国煤炭铁路物流需求预测这种小样本,非线性及高维模式识别问题中PSO-SVR模型预测精度优于BP神经网络模型。  相似文献   

19.
骆珣  牛晓晨 《科技和产业》2014,14(11):95-98
为了对上市公司财务状况进行合理预测,利用神经网络模型进行企业财务预警研究。首先,运用主成分分析等统计方法对初选的财务指标进行筛选,从初始指标中提取了五个因子作为财务预警指标;然后,选取2010至2013年间首次被特殊处理的上市公司作为财务危机样本企业,构建的财务预警模型提前三年的预测准确度近似于90%。研究结果表明,神经网络模型对我国上市公司财务状况预测具有较高的准确度,并且对预警指标进行适当的预处理,会提高模型预测的准确率。  相似文献   

20.
华龙  齐冲  刘雪娇 《科技和产业》2023,23(24):63-67
在采用径向基函数神经网络(RBFN)对太阳能发电系统输出功率进行预测的模型中,可以明确日照强度的精度对整个预测系统的精度起到了决定性的作用。通过在RBFN模型中引入模糊规则,改善云量数据的精准度,进而提高预测模型的精度。仿真结果表明,加入了模糊规则的模型,预测曲线更为近似。在全面考虑模糊的基础上,有可能提高预测精度。同时也证明了该方法可用于实际应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号