排序方式: 共有15条查询结果,搜索用时 15 毫秒
1.
正有统计表明,一个组织80%的信息是以文本的形式存放的,这些文本通常包括同领域的技术文档、Internet上的博客、论坛帖子等Web页面以及日常联系的电子邮件等。传统基于数据库的数据挖掘技术遇到了难以回避的问题,人们必须探求从大量的文本集合中发现新的知识。如何从庞大的非结构化文本信息中获取人们所感兴趣和需要的信息,成为数据挖掘以及智能信息处理领域的热点问题。文本挖掘技术就是为了解决这一问题而产生的。 相似文献
2.
英汉机器翻译目前仍然是中文信息处理的瓶颈问题,实用的英汉翻译软件并不多见。在可读性方面,市场上的翻译软件不能完全满足用户的需求。造成这种局面的因素主要是语言的复杂性和语言间的不对称性,但对于机器翻译爱好者来说,是否可以从方法上再去考虑呢?下面是我们的一些粗浅看法,希望专家们指正。一、基于规则的翻译系统与基于语料的翻译系统在大多数的英汉翻译软件中,实现从英语到汉语的转换的基本步骤是:预处理→词法分析→语法分析→语义分析→翻译实现。一般的英汉翻译软件都是基于语法规则的,预处理阶段的主要工作是“查字典… 相似文献
3.
4.
技术和资本是一柄双刃剑,二者结合方能剑锋出鞘。本刊曾多次报道汤建民先生"双拼双笔"和"双笔双拼"编码输入法的专利发明事迹,日前,欣悉此项目在加拿大籍华侨、益豪集团(香港)有限公司董事长、广州增城市新塘环保综合治理工程有限公司董事、总经理袁运南先生的投资拉动下,与济南浪潮世科公司合作开发,此专利成果已向商品化、产业化方向成功起步,不久将推向市场。记者就此采访了实业家、投资人袁运南先生。记者:袁董,您好!我国高新科技产业化是新世纪的主旋律,请问您对高科技产业化有何高见?袁:高科技是计算机、生物医药、新材料等十大科技前沿技术,近代世界经济的发展主要来源于科技的进步。在我国还有许多技术创新成果没有得到应有的重视和资金支持,这是对知识财富一种巨大的浪费。我国已加入世贸组织,以专利技术打造核心竞争力,是高新技术产业界的挑战,更是高新技术产业化的新机遇。记者:请您谈谈汤码汉字输入平台有何特点?袁:汉字输入法,大体上可划分为音码、形码、音形码和数字码等 相似文献
5.
潍坊北大青鸟华光照排有限公司是传媒行业技术、产品和服务的专业厂商,从事中文信息处理相关产品项目的研发已30余年,为推动我国新闻出版技术的发展作出了贡献。近几年,华光多次担纲国家级重大项目的研发,广泛参与制定行业标准,相关产品和项目先后荣获中国报业协会技术进步奖、钱伟长中文信息处理科学技术奖、王选新闻科学技术奖等多个奖项。 相似文献
7.
邓箴 《中小企业管理与科技》2012,(13)
词汇倾向性计算是自然语言处理研究领域的一个新的热点。词语倾向性的判定是意见挖掘的基础和重要环节。本文基于本体概念提出了一种词汇语义倾向性计算的方法。实验表明,本文的方法在汉语常用词中的效果较好,词频加权后的判别率更高,具有一定的实用价值。 相似文献
9.
祁文青 《黄石理工学院学报》2007,23(4):23-25,37
汉语自动分词是汉语信息处理的前提,词库是汉语自动分词的基础.文章提出了一种在对词库进行改造的基础上改进的匹配算法,突破了最大匹配分词算法分词的长度限制,提高了中文分词的速度和效率. 相似文献
10.
随着Intemet规模的不断增长,互联网上信息资源也快速膨胀起来.网络资源的扩大和其具有的异构性、开放型和分布性有着直接的关系,但是用户想在网络上准确、快速的得到信息变得更加困难,而中文搜索引擎的出现转变了这种状况.本文分析了中文信息处理的难点和特殊性,对如何扫描分析HIML文档、中文自动分词技术以及转换汉字码制的基本方式进行介绍. 相似文献