首页 | 本学科首页   官方微博 | 高级检索  
     

中日双语平行语料库之日语科技语标注技术
作者姓名:李毅鹏
作者单位:东莞职业技术学院应用外语系,广东 东莞,523808
基金项目:本文章为东莞市科技局2012年市级课题《基于CAT的科技行业中日平行语料库加工技术与应用研究》,立项编号2012108102003,之研究成果。
摘    要:中日双语平行语料库由中文和日文两种语言组成,在研发阶段,我们主要从语言学角度对这两种语言进行对比和分析。无论是从语言形态还是整篇文章的结构来看,中日文都有着共同的特性。在计算机数据处理时,只有对两种语言同时进行标注,才能达到互译的效果。目前,大多数语料库采用数据库处理和文本处理相结合的组织模式,采用XML(Extend Marking Language)标记语言。现如今双语平行语料库最流行的项目是应用于XML的语义标注技术,该标记语言的优点在于语料处理比较直观,基本和实际的文章相似,弥补了同类标注技术的不足。

关 键 词:科技日语  标注技术  XML  中日双语
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号