首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
韩鹏 《民营科技》2009,(4):28-28
提出了一种基于MI方法和DF组合成特征提取方法,对中文文本进行实验,测试结果表明组合特征可有效提高文本分类精度。  相似文献   

2.
在关键词抽取方法研究中,提出了多步骤的中文文本关键词抽取方法。该方法采用一元、二元及三元文法进行文本候选关键词的抽取,提出基于语言学特征的扩展tf/idf关键词的加权计算方法,以及对抽取未登录词的关键词的方法和对关键词抽取进行优化的策略。  相似文献   

3.
为促进项目参与方的合作和交流从而使项目更优质高效的完成,研究了结合IFC标准进行建设项目文档分类的方法。在对建设项目管理的特点进行深入分析的基础上,文章提出了将项目生命期中产生的大量的半结构化或非结构化的中文文本按照国际通用的IFC标准进行分类的方法,从而改进了文本的管理与利用效果。通过空间向量模型来表示中文文本,并采用夹角余弦的方法与国际通用的IFC标准中的实体进行相似度计算,最终实现中文文本的标准化分类,并通过案例分析验证了该方法的可行性。最后对本文提出的算法进行了评价,并提出了下一步的研究方向。  相似文献   

4.
文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文首先对基于空间向量模型的文本聚类过程做了较深入的讨论和总结。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已有成果的基础上,本文利用20Newsgroup文本语料库,针对向量空间表示模型,在开源的数据挖掘平台WEKA上实现了文本预处理和k-means聚类算法,并根据实际聚类效果,就文本表示、特征选择、特征降维等方面提出优化方案。  相似文献   

5.
中文分词是中文文本挖掘的重要环节。中文分词的方法主要有基于辞典与规则和基于统计两种,"基于串频统计和词形匹配的分词系统"在一定程度上结合了中文分词两种方法的优点于一体,它充分利用文本本身的信息建立临时辞典,再配合一定的常用辞典,用词形匹配的方法达到分词的目的。  相似文献   

6.
本文针对资本市场中普遍存在的上市公司财务欺诈问题,在财报数据中融入财经新闻文本特征,并提取时序信息,为上市公司财务欺诈预警提供新途径。以结构化的财报数据和非结构化的新闻文本数据为对象,在结构化数据特征中融入新闻文本的主题特征、观点特征、情绪特征和欺诈特征,然后提取时序信息,并基于树集成的方法实现上市公司财务欺诈预警。本文融合预警欺诈行为的方法在CSMAR财报数据集和爬取的新浪财经数据集上达到了86.1%的准确率和86.5%的召回率,融入新闻特征和时序信息后比单纯地采用财报数据特征的准确率提高了8%。新闻文本特征可以作为财报数据的有效补充,且在财报数据和新闻文本数据中引入时序信息有利于提高上市公司财务欺诈的预警性能。  相似文献   

7.
文本的生成模型是基于文本向量空间表示基础上,针对文本数据的概率表示,针对文本的产生过程进行统计建模的方法。生成模型的优势在于在准确描述表示文本的前提下,达到提高文本挖掘效率的目的。同时,根植于概率统计的生成模型,拥有一整套用于模型学习、推论、模型比较、选择的理论和方法,是其他非统计方法所无法比拟的。本文介绍了用于描述可交换的离散数据集合主要的几种概率生成模型,在向量空间表示的基础上能够捕捉不同程度的词与词之间的上下文(主题)依赖性,因而在英文文本的挖掘上得到了一定程度的应用和肯定。  相似文献   

8.
从工程实际出发,介绍了在英文AutoCAD中输入汉字、修改汉字文本方法,较好地解决了AutoCAD与中文Word的图形变换,及用打印机输出大幅面纸的问题。  相似文献   

9.
梦蝶 《审计月刊》2004,(5):54-54
该书源于哲学家冯友兰先生于1947年在美国宾夕凡尼亚大学讲授中国哲学史的英文讲稿,后经整理,于1948年由麦克米伦公司出版。此书出版后,又有法文、意大利文和南斯拉夫文的译本出版,在欧美很有影响。最近,著者的学生涂又光据英文本译为中文,弥补了此书过去没有中文本的遗憾。该书作者冯友兰先生学贯中西,在言必称西学的二三十年代潜心研究中国哲  相似文献   

10.
新型冠状病毒肺炎疫情给非洲国家国际中文教育造成了重大冲击,以大国竞争为特征的大变局时代赋予国际中文教育新内涵与新使命。本文分析了后疫情时代非洲国家国际中文教育现状,基于当前非洲国家国情与国际中文教育OMO(Online-Merge-Offline,即:线上线下相融合)教育现实情况,尝试提出构建“非洲区域性国际中文教育共同体”及实施“国际中文+实用学科”职业教育人才培养模式。  相似文献   

11.
根据国家质检总局发布的《产品标识标注规定》的要求,产品应当具有标识。产品标识是指用于识别产品及其质量、数量、特征、特性和使用方法所作的各种标注的统称。产品标识可以用文字、符号、数字、图案以及其它说明物等表示。产品标识所用文字应当为规范中文。可以同时使用汉语拼音或外文,汉语拼音和外文应小于相应中文。产品标识使用的汉字、数字和字母,其字体高度不得小于1.8毫米。产品标识应当包括以下内容:首先要有产品名称。产品名称应表明产品国家标准和行业标准对产的,要采用国家标准和行业称;国家标准、行业标准对规定的,…  相似文献   

12.
根据国家质检总局发布的《产品标识标注规定》的要求,产品应当具有标识。产品标识是指用于识别产品及其质量、数量、特征、特性和使用方法所作的各种标注的统称。产品标识可以用文字、符号、数字、图案以及其它说明物等表示。产品标识所用文字应当为规范中文。可以同时使用汉语拼音或外文,汉语拼音和外文应小于相应中文。产品标识使用的汉字、数字和字母,其字体高度不得小于1.8毫米。产品标识应当包括以下内容:首先要有产品名称。产品名称应表明产品的真实属性,国家标准和行业标准对产品名称有规定的,要采用国家标准和行业标准规定的…  相似文献   

13.
任何出版物的版面均由文字、符号、装饰性图片组成,但最为重要的信息是来自于文字。在中文出版物中,汉字占了版面的很大比例,所以汉字的排版印刷用字对文本信息的输出是至关重要的,这就要求印刷用汉字不仅要规范,方便阅读,还要使版面更加的赏心悦目,条理清晰。  相似文献   

14.
费尔的决策,主要的意义绝不是表示决策应标新立异,也不是表示决策应有引人争议的特性,而是表示出决策的以下五点特征:  相似文献   

15.
ПpeдeдeHT(先例)一词源于拉丁语praecedens(以前的)表示“过去曾有过的现象”之意,npeдeдeHTHъIй тескт(先例文本)一词最早由俄罗斯语言学家卡拉乌罗夫(KapayЛоB)提出。先例文本(又可称先例名词),即历史上形成的某一文本,其中包含着各种不同的文化背景知识,而这些背景知识又是一个民族的知识、经验、宗教信仰、价值观念的总和,它渗透于该民族社会生活的各个方面,深深根植于该社会群体的集体潜意识中,并被社会语言集团(социолингвогруппа)的普通成员所熟悉。  相似文献   

16.
利用文本分析技术,基于2015~2021年我国A股上市公司年报大样本数据,检验年报文本信息可读性对审计师行为决策的影响。研究发现,企业年报文本信息可读性越低,审计师出具非标准审计意见的概率以及审计收费越高。在由国内“十大”会计师事务所审计的企业中,企业年报文本信息可读性对审计师行为决策的影响更加显著。在控制了年报文本信息其他特征及内生性问题后,结论依然稳健。进一步研究中,对企业年报文本信息可读性影响审计师行为决策的作用机制进行了推理和检验。结果发现,审计风险和审计投入是年报文本信息可读性影响审计师行为决策的内在机理。同时,探讨和验证了企业异质性对年报文本信息可读性与审计师行为决策关系的影响,发现两者的关系在非国有企业、信息披露质量等级较高的企业中得到了缓解。  相似文献   

17.
开展人工智能数据分析技术研究,研究掌握运用人工智能数据分析技术实现智能过滤短信;集成采用智能分析算法、文本挖掘、中文分词、文本搜索算法及神经网络智能分析等技术手段,自动实现对垃圾信息的准确分类过滤;建立一套科学合理和可操作性强的垃圾短信治理重要技术方案。  相似文献   

18.
陈媛  杨轶 《财会通讯》2008,(9):114-115
一、财务风险警情物元模型构建 任何事物都可用“事物、特征、量值”三个要素来加以描述,以便对事物作定性和定量分析与计算。用这三个要素组成有序三元组来描述事物的基本元,即称为物元。若以R表示物元,M表示事物,C表示事物M的特征,V(X)表示与事物特征C相应的量值,即事物M对其特征C相应量值X的隶属度,则有:R=(事物,特征,量值)=(M,c,v)。设上市公司财务风险警情测度的定量指标有111个,即为C1,C2,…Cm,以这部分指标为基础,将财务风险警情分为n个标准模式或等级,将其描述为以下的综合物元模型,也即可拓学中的“经典域”即:  相似文献   

19.
《上海质量》2004,(10):50-52
今年是朱兰100岁诞辰,朱兰研究院成立25周年。为表示我们对朱兰先生的崇敬,由上海朱兰质量研究院翻译、中国财政经济出版社出版的《朱兰自传》中文简体版已经开始在新华书店发行,上海市泰安路74号的质量书店也有售,电话:62828208。全书共20余万字分三个部分50章,记录  相似文献   

20.
法规     
建设部 国家工商行政管理局关于印发《商品房买卖合同示范文本》的通知建住房[2000]200号各省、自治区、直辖市建委(建设厅)、工商行政管理局:根据《中华人民共和国合同法》和近几年来商品房买卖中存在的问题,建设部、国家工商行政管理局对1995年印发的《商品房购销合同示范文本》进行了修订,并更名为《商品房买卖合同示范文本)(以下简称《示范文本》)。现将《示范文本》印发给你们,并就有关问题通知如下:一、充分认识推行《示范文本》的意义,大力推广使用《示范文本》。近年来,消费者对商品房投诉较多,投诉的主要问题有:广告虚假、一房多售、面积缩水、质量低劣、延期交房、产权纠纷等。出现这些问题,有制度不健全、管理不到位的原因,也有合同不规范的原因。这些问题的出现不仅损害了消费者的合法权益,而且也将影响到住房消费热点的形成。推行《示范文本》,有利于保护当事人的合法权益,避免因合同缺款少项和当事人意思表示不真实、不确切,而出现显失公平和违法条款;有利于减少商品房买卖合同纠纷,促进合同纠纷的解决;有利于调动消费者的购房热情,促进住房消费,拉动经济增长。各地要以推行新的《示范文本》为契机,加强房地产市场管理,规范商品房销售行为,切实...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号