首页 | 本学科首页   官方微博 | 高级检索  
     

基于新词识别的大数据聊天文本舆情热点挖掘
作者单位:;1.安徽国际商务职业学院;2.合肥工业大学计算机与信息学院
摘    要:热点是在一段时间内用户文本涉及最多的热议焦点。大数据聊天文本的研究可以帮助用户及时了解当下文本热点话题和热门事件,帮助企业了解和评测用户关心的热点,且使得对社会舆情热点有明确的方向把握。因此对大数据聊天文本的研究有广泛的适用性和研究价值。由于聊天文本自由度大、语法不规范、即时性强大特点,引擎通过传统的文本分析难以对微博热点进行准确的把握。本文中通过对一个时间跨度的文本特征进行处理,通过加入跨度的时间信息来决策是否为热点词。通过实验,挖掘出的热点词与相应的热点事件相对应,说明本文提出的方法有不错的使用效果,可以进行更深入的研究。

关 键 词:热点识别  分词  时间跨度特征  舆情分析
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号