基于维基百科的领域实体上下位关系抽取 |
| |
作者单位: | ;1.昆明理工大学信息工程与自动化学院 |
| |
摘 要: | 针对维基百科中旅游领域词条的结构特点,本文提出利用结构特点自动获取特定结构的领域命名实体和层次结构。首先,我们利用维基百科的结构特点抽取候选领域命名实体,并利用条件随机场抽取剩余实体;其次,利用维基百科的层次结构构建层次结构;然后,使用模式对层次结构中的实体对进行验证,并利用模式匹配已获取的候选实体对来补充层次结构;最后,使用特征和支持向量机相结合获取剩余语料中的领域命名实体上下位关系对,并添加到层次结构中对其进行补充。
|
关 键 词: | 条件随机场 模式匹配 支持向量机 |
Hyponymy Extraction of Domain Entity Based on Wikipedia |
| |
Abstract: | |
| |
Keywords: | |
|
|