排序方式: 共有3条查询结果,搜索用时 15 毫秒
1
1.
随着各种数字化信息不断增长,如何对大量文档信息进行科学归类成为亟待解决的问题.文本自动分类方法成为目前解决该问题的一项关键技术.我国目前有超过1,000万的企业,企业经营范围是企业从事经营活动的具体描述.本文以企业经营范围数据为基础,根据其结构特征,以及与经济行业的关系,利用大规模文本数据的切分词优化、统计分类推断、属性关联分析等关键技术,通过在组织机构代码数据库中提炼相关数据进行实验比对分析,从而得出一种实用、高效的企业经营范围的文本自动分类方法. 相似文献
2.
3.
本文以涵盖各类单位动态基本信息的全国组织机构代码数据库为基础,依托当前自然语言自动处理技术的成功经验和研究成果,探究实现大规模机构信息自由文本数据的信息抽取、切分词优化、统计分类推断、属性关联分析等方法.为“全国组织机构代码共享平台”实现核心字段动态自动翻译、知识发现、数据质量提高,以及信息自动填补等方面提供关键技术支撑,进而为提高数据库信息利用率提供技术参考,为积极推进国家电子政务信息建设做出有益探索. 相似文献
1