中日双语平行语料库之日语科技语标注技术 |
| |
作者姓名: | 李毅鹏 |
| |
作者单位: | 东莞职业技术学院应用外语系,广东 东莞,523808 |
| |
基金项目: | 本文章为东莞市科技局2012年市级课题《基于CAT的科技行业中日平行语料库加工技术与应用研究》,立项编号2012108102003,之研究成果。 |
| |
摘 要: | 中日双语平行语料库由中文和日文两种语言组成,在研发阶段,我们主要从语言学角度对这两种语言进行对比和分析。无论是从语言形态还是整篇文章的结构来看,中日文都有着共同的特性。在计算机数据处理时,只有对两种语言同时进行标注,才能达到互译的效果。目前,大多数语料库采用数据库处理和文本处理相结合的组织模式,采用XML(Extend Marking Language)标记语言。现如今双语平行语料库最流行的项目是应用于XML的语义标注技术,该标记语言的优点在于语料处理比较直观,基本和实际的文章相似,弥补了同类标注技术的不足。
|
关 键 词: | 科技日语 标注技术 XML 中日双语 |
本文献已被 万方数据 等数据库收录! |
|