首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 27 毫秒
1.
谭敏 《价值工程》2011,30(11):191-192
针对传统模式下公安情报人员手工识别情报周期长、费用高、效率低等缺点,本文深入研究了文本分类技术和支持向量机(SVM)理论,设计了基于SVM的公安情报自动分类系统,并用UML对系统进行分析和建模,该系统可以提高情报文本分类的效率,为进一步的情报加工处理提供支持。  相似文献   

2.
文章针对水利工程施工安全隐患文本的智能分类、挖掘和排查方法进行研究,提出基于机器学习和自然语言处理的方法,实现安全隐患文本的自动分类和排查线索挖掘。首先,对安全隐患文本进行预处理,提取文本特征并采用随机森林模型将文本分类为10个类别;其次,利用词云图和词频统计方法展现安全隐患的管理要点;最后,利用序列相似度匹配算法和隐含狄利克雷分布模型,从原始隐患数据中找出包含高频安全隐患核心词的代表性隐患数据,作为隐患排查线索,指导安全管理实践。文章提出的方法可以有效地提高水利工程施工安全隐患文本的分类准确率,挖掘隐患文本中有价值的信息,缩小隐患排查的范围,提高水利工程安全管理的效率和水平。  相似文献   

3.
韩鹏 《民营科技》2009,(4):28-28
提出了一种基于MI方法和DF组合成特征提取方法,对中文文本进行实验,测试结果表明组合特征可有效提高文本分类精度。  相似文献   

4.
姜亮  张梅梅 《会计之友》2021,(10):37-41
当前我国税收政策更新速度快,所涉部门多,仅靠财务部门人工搜集、分析、组织实施效率低下,导致企业错失应税减税机会,因此税收政策文本的实时学习和自动分发成为加强企业应税管理、降本增效的首要任务.文章设计税政文本挖掘系统来实现税政文本自动学习和分发:首先,分析税收政策文档;其次,利用分词系统和TF-IDF算法提取每个文本的特征,用贝叶斯、决策树和随机森林三种分类器进行文本分类,并将结果与人工标注结果进行对照;最后,计算三种分类算法的混淆矩阵、准确率和召回率.实验结果表明,随机森林算法文本识别正确率最高,税政文本挖掘系统采用该算法进行识别和自动分发,据此部署部门协同工作,能显著提升公司财税管理工作的全局性和协同性.  相似文献   

5.
姜亮  张梅梅 《会计之友》2021,(10):37-41
当前我国税收政策更新速度快,所涉部门多,仅靠财务部门人工搜集、分析、组织实施效率低下,导致企业错失应税减税机会,因此税收政策文本的实时学习和自动分发成为加强企业应税管理、降本增效的首要任务.文章设计税政文本挖掘系统来实现税政文本自动学习和分发:首先,分析税收政策文档;其次,利用分词系统和TF-IDF算法提取每个文本的特征,用贝叶斯、决策树和随机森林三种分类器进行文本分类,并将结果与人工标注结果进行对照;最后,计算三种分类算法的混淆矩阵、准确率和召回率.实验结果表明,随机森林算法文本识别正确率最高,税政文本挖掘系统采用该算法进行识别和自动分发,据此部署部门协同工作,能显著提升公司财税管理工作的全局性和协同性.  相似文献   

6.
当前,科技期刊面临融合出版的挑战,截至2017年底,全国拥有科技期刊2 052种,在此现状下,科技期刊评价能促使期刊行业的健康发展。文章对文本挖掘在期刊评价的应用进行了深入探究,针对基于分类词典的文本相似度量等方法,进行了详细的分析。  相似文献   

7.
夏艳辉  聂百胜  胡金凤 《价值工程》2019,38(16):147-149
中文问答系统通常由问题分析、信息检索、答案抽取组成。其中,问题分析中的问题的分类是否准确会直接关系到提取答案的准确度,所以在问答系统中起到关键性作用。本文主要介绍了中文问答系统的结构、问题分类体系以及方法,并提出结合基于规则的模式匹配与基于统计的机器学习的方法对问题进行分类,从而提高分类的准确度。  相似文献   

8.
文章从研究文本情感和股价的关联关系入手,特别面向网络股评,提出了一种基于金融文本情感股价关联挖掘模型。首先,为了获取股评情感指数,模型应用了适合股评情感分类任务的分类器。其次,模型应用了适合挖掘预测任务的神经网络,用以学习股票价格和情感指数之间的关联规律,并用其预测未来股价走势。  相似文献   

9.
丁应逵 《价值工程》2014,(2):180-182
分类是数据挖掘的重要组成部分,它根据类标号已知的数据建立模型,进而使用该模型来预测类标号未知的数据所属的类。KNN方法作为一种简单、有效、非参数的分类方法,在文本分类中得到广泛的应用,但是这种方法在训练样本的分布不均匀时会造成分类准确率的下降。针对KNN方法存在的这个问题,本文提出了一种基于相对距离的KNN分类方法,这种方法减少了边界点处测试样本的误判。实验结果显示,这种方法具有很好的性能。  相似文献   

10.
中文分词是中文文本挖掘的重要环节。中文分词的方法主要有基于辞典与规则和基于统计两种,"基于串频统计和词形匹配的分词系统"在一定程度上结合了中文分词两种方法的优点于一体,它充分利用文本本身的信息建立临时辞典,再配合一定的常用辞典,用词形匹配的方法达到分词的目的。  相似文献   

11.
《中国文书》标准化应用系统软件,对中国文书进行了全面系统的整理、分析、研究,进而归纳、分类、形成计算机分类格式文本和格式模型,并按中办、国办及各部委的规范行文格式制作了各种公文模板和公文表格。工作平台与丰富的资料库融为一体是本系统的最大特色,调用、查阅方便,能大大提高办公效率,参谋和助手“用”之即来。一、主要功能  相似文献   

12.
《价值工程》2016,(29):199-201
提出了一套基于Roberts算子和最大方差阈值算法的GUI车牌图像识别系统。针对相机或高清视频流所采集的照片,本文结合图片的预处理,采用梯度检测法进行边缘检测,基于像素点的先行后列的车牌定位方法,并用最大阈值方差法进行二值化处理,根据对二值边缘图像做积分Harr识别,把车牌信息从图像转化为文本输出。实验结果表明,该GUI系统能够正确实现识别车牌图像文本信息。  相似文献   

13.
为促进项目参与方的合作和交流从而使项目更优质高效的完成,研究了结合IFC标准进行建设项目文档分类的方法。在对建设项目管理的特点进行深入分析的基础上,文章提出了将项目生命期中产生的大量的半结构化或非结构化的中文文本按照国际通用的IFC标准进行分类的方法,从而改进了文本的管理与利用效果。通过空间向量模型来表示中文文本,并采用夹角余弦的方法与国际通用的IFC标准中的实体进行相似度计算,最终实现中文文本的标准化分类,并通过案例分析验证了该方法的可行性。最后对本文提出的算法进行了评价,并提出了下一步的研究方向。  相似文献   

14.
赖庆 《民营科技》2008,(11):30-31
介绍了基于文本的网络图像搜索技术的搜索原理、对图像与文本的关联特性和文本匹配技术进行了分析,指出了基于文本的网络图像搜索技术缺陷和发展趋势。  相似文献   

15.
随着各种数字化信息不断增长,如何对大量文档信息进行科学归类成为亟待解决的问题.文本自动分类方法成为目前解决该问题的一项关键技术.我国目前有超过1,000万的企业,企业经营范围是企业从事经营活动的具体描述.本文以企业经营范围数据为基础,根据其结构特征,以及与经济行业的关系,利用大规模文本数据的切分词优化、统计分类推断、属性关联分析等关键技术,通过在组织机构代码数据库中提炼相关数据进行实验比对分析,从而得出一种实用、高效的企业经营范围的文本自动分类方法.  相似文献   

16.
蒋伟亮  刘源 《价值工程》2021,40(35):128-131
随着科技与经济的高速发展,合理利用垃圾资源已经成为我国主要问题之一.为解决目前垃圾分类中分类效率低下的问题,本文通过对ResNet卷积神经网络的运用,提出了一种基于微型计算机的垃圾分类系统,该系统使用树莓派作为主控设备,以华为垃圾分类挑战赛数据集作为本次数据集,实现了准确识别垃圾种类并将垃圾分类的功能,同时通过对舵机的控制实现了垃圾箱的开合动作.测试结果表明,该系统具有较好的垃圾识别和分类功能.  相似文献   

17.
随着环境问题日益严峻、全球环保趋势的推动,也包括国家政策的支持和公众认知的提高,垃圾分类尤为重要。为了解决日益增多的生活垃圾带来的难题,提出了一种基于深度学习的智能垃圾分类系统。该系统结合最新的垃圾分类标准规范,以计算机视觉深度学习为基础结合深度学习相关知识建立垃圾智能分类算法模型,并编写可视化应用程序实现垃圾图片快速读取、识别等功能,能高效解决垃圾分类问题。  相似文献   

18.
张瑞 《管理观察》2017,(13):28-30
近年来,随着互联网广泛作为人们交流和表达的工具,文本情感计算成为了热点研究方向。本文针对文本情感计算相关研究进行综述。归纳不同领域的诸多学者对于情感类型的划分;介绍文本情感识别中三个主要问题的研究情况:文本情感特征标注、情感特征提取算法和文本情感分类技术。未来的研究可关注以下几点:建立统一的实验语料和词典;情感特征提取方面研究;语义成分的理解和识别。  相似文献   

19.
财经时讯     
《财务与会计》2015,(11):4-5
YAOWEN要闻财政部征集企业会计准则通用分类标准典型实施应用案例近日,财政部组织开展通用分类标准典型实施应用案例征集工作。案例征集范围为企业基于通用分类标准已经实施的项目,项目目标包括但不限于:基于通用分类标准整合优化企业财务报告流程,提升财务报告编制效率和质量;基于通用分类标准构建企业统一对外报告报送系统,实现财务报告与监管报告信息的一次标记、多次使用;基于通用分类标准构建企业内部统一的会计信息数据标准并应用于企业内部管理报告;基于通用分类标准统一财务、业务数据标准,实现业财有机结合,构建企业统一数据平台和数据仓库。财政部将根据申报材料选择有代表性的、实施成效明显的案例,联合申报单位进一步梳理总结经验,建立全国通用分类标准典型实施应用案例库,在全国范围内进行宣传推广。  相似文献   

20.
不同类的模式可以被区分熏因为它们所属类别在特征空间中的类域是不同的区域。显然这些区域重叠的部分越小或者完全没有重叠,类别的可分性越好,因此可以用几何距离或离差测度来构造类别可分性判据。为了处理方便和节省资源,而又不影响识别的正确率,需要一定的方法提取对分类识别最有效、数目最少的特征。文章从模式识别工程的角度出发,运用基于几何距离可分性判据对通信类文本进行了特征提取,并用提取后的特征向量对训练样本以外的文本进行识别,得到了较好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号