基于文本挖掘的海外矿产资源开发项目动态风险评价特征选择算法研究 |
| |
作者姓名: | 胡东滨 李雪 徐丽华 |
| |
作者单位: | 中南大学 商学院,湖南 长沙 410083;湖南湘信评估有限公司,湖南 长沙,410082 |
| |
基金项目: | 教育部人文社会科学研究项目(11YJA630030);国家自然科学基金项目(71271216);中国工程院咨询研究项目(2013-XY-9) |
| |
摘 要: | 风险分析是海外矿产资源开发项目成败的关键。已有研究显示不断迅速更新的、含大量信息的文本数据,可以通过文本分类动态评价海外矿业投资项目风险。文本分类作为文本挖掘的重要应用,其能否取得较好的分类效果,对特征集进行降维处理成为关键环节。在研究常用特征选择方法的基础上,利用词频及特征项的类别分布信息,改进原有的频度、类间集中度、类内分散度3个指标,提出新的特征选择方法TFTD。实验采用朴素贝叶斯、KNN、SVM分类器,并将信息增益(IG)、χ+2统计量(CHI)、文档频率(DF)、基尼指数(Gini index)与TFTD方法进行比较,结果表明TFTD的特征降维处理可以在分类器上获得较好的分类效果。
|
关 键 词: | 动态风险评价 文本挖掘 特征选择 |
收稿时间: | 2014-03-31 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《科技进步与对策》浏览原始摘要信息 |
|
点击此处可从《科技进步与对策》下载全文 |