基于卷积神经网络的文档特征提取方法 |
| |
引用本文: | 刘钢,李宗晨,郭建伟.基于卷积神经网络的文档特征提取方法[J].江苏科技信息,2018(14). |
| |
作者姓名: | 刘钢 李宗晨 郭建伟 |
| |
作者单位: | 长春工业大学计算机科学与工程学院;长春金融高等专科学校现代教育中心 |
| |
摘 要: | 随着上网用户的增多,人们在网络上贡献了各式各样的文献,这些文献形成了海量的文本数据,潜藏着巨大的价值。文献的文类和整理是一项非常具有挑战性的工作,抽取文档特征信息成了目前重要研究方向之一。针对传统方法对文本数据的特征提取时,文本特征维数大、处理效率低等问题,文章设计了基于卷积神经网络的文本特征提取方法,搭建了卷积神经网络模型,选取了卷积神经网络的各项参数,实验的输入数据集为中文语料库中的文本,使用Word2vec工具集进行文本向量转换,对文本特征提取采用卷积神经网络算法,通过K-means聚类算法对文本特征进行验证,验证了本文设计的基于卷积神经网络的文本特征提取方法的有效性。
|
本文献已被 CNKI 等数据库收录! |
|