首页 | 本学科首页   官方微博 | 高级检索  
     

基于PLSA模型的观点句聚类算法研究
作者单位:;1.昆明理工大学信息工程与自动化学院
摘    要:针对互联网评论文本中观点句情感特征的稀疏性及低频性,提出一种基于概率潜在语义分析(PLSA)模型的观点句聚类算法。利用PLSA对语料库中的观点句进行数据预处理与数据聚类,并以微平均F1为评价指标设计与采用潜在语义分析(LSA)方法的对比实验。分析与研究结果表明:(1)主题数在20附近时,聚类效果最为显著;主题数超过20时,聚类效果随着主题数的增加呈递减趋势,之后聚类效果趋于稳定;(2)与LSA算法相比,PLSA算法显示出较好的聚类效果,数据测试结果验证了该模型的有效性。研究结果对提高信息检索速度与个性化推送服务具有重要意义。

关 键 词:观点句  聚类分析  PLSA  微平均F1  对比实验

Research of Opinion Sentences Clustering Algorithm Based on PLSA Model
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号