首页 | 本学科首页   官方微博 | 高级检索  
     

面向新闻领域的中文实体关系抽取
引用本文:王 博,王 侃,王成刚,刘 然,刘威鹏,黄慧荣. 面向新闻领域的中文实体关系抽取[J]. 国际商务研究, 2021, 61(1)
作者姓名:王 博  王 侃  王成刚  刘 然  刘威鹏  黄慧荣
作者单位:1.北京信息技术研究所,北京 100093;中国西南电子技术研究所,成都 610036;3.西北工业大学 网络空间安全学院,西安 710129
摘    要:随着互联网技术的快速发展,人们能够及时地获取大量的新闻文本信息,如何从新闻中自动获取关键信息,把新闻中具有价值的信息转化为结构化数据,从而快速有效地获取有用的知识已是迫切需求。实体关系抽取是获取关键信息的方法之一,但目前关于中文的实体关系抽取工作较少。针对基于长短时记忆网络的中文实体识别模型难于提取长距离的依存关系特征和句法特征问题,提出利用双向树形长短时记忆神经网络提取依存句法树的结构特征。在提取的特征的基础上,使用条件随机场判断实体的类别和边界,并在实体识别模型中加入注意力机制提高模型的性能。在《人民日报》数据集和ACE 2005语料库上训练模型,验证了模型的有效性。

关 键 词:新闻文本信息;实体关系抽取;长短时记忆网络  最短依存路径  条件随机场  注意力机制

Chinese Entity Relationship Extraction for Journalism
WANG Bo,WANG Kan,WANG Chenggang,LIU Ran,LIU Weipeng,HUANG Huirong. Chinese Entity Relationship Extraction for Journalism[J]. International Business Research, 2021, 61(1)
Authors:WANG Bo  WANG Kan  WANG Chenggang  LIU Ran  LIU Weipeng  HUANG Huirong
Abstract:
Keywords:news text information  entity relationship extraction  long-short-term memory neural network  shortest dependency path  conditional random field  attention mechanism
点击此处可从《国际商务研究》浏览原始摘要信息
点击此处可从《国际商务研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号