共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
在关键词抽取方法研究中,提出了多步骤的中文文本关键词抽取方法。该方法采用一元、二元及三元文法进行文本候选关键词的抽取,提出基于语言学特征的扩展tf/idf关键词的加权计算方法,以及对抽取未登录词的关键词的方法和对关键词抽取进行优化的策略。 相似文献
3.
为促进项目参与方的合作和交流从而使项目更优质高效的完成,研究了结合IFC标准进行建设项目文档分类的方法。在对建设项目管理的特点进行深入分析的基础上,文章提出了将项目生命期中产生的大量的半结构化或非结构化的中文文本按照国际通用的IFC标准进行分类的方法,从而改进了文本的管理与利用效果。通过空间向量模型来表示中文文本,并采用夹角余弦的方法与国际通用的IFC标准中的实体进行相似度计算,最终实现中文文本的标准化分类,并通过案例分析验证了该方法的可行性。最后对本文提出的算法进行了评价,并提出了下一步的研究方向。 相似文献
4.
文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文首先对基于空间向量模型的文本聚类过程做了较深入的讨论和总结。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已有成果的基础上,本文利用20Newsgroup文本语料库,针对向量空间表示模型,在开源的数据挖掘平台WEKA上实现了文本预处理和k-means聚类算法,并根据实际聚类效果,就文本表示、特征选择、特征降维等方面提出优化方案。 相似文献
5.
沈静 《中国高新技术企业评价》2008,(13):111-112
中文分词是中文文本挖掘的重要环节。中文分词的方法主要有基于辞典与规则和基于统计两种,"基于串频统计和词形匹配的分词系统"在一定程度上结合了中文分词两种方法的优点于一体,它充分利用文本本身的信息建立临时辞典,再配合一定的常用辞典,用词形匹配的方法达到分词的目的。 相似文献
6.
本文针对资本市场中普遍存在的上市公司财务欺诈问题,在财报数据中融入财经新闻文本特征,并提取时序信息,为上市公司财务欺诈预警提供新途径。以结构化的财报数据和非结构化的新闻文本数据为对象,在结构化数据特征中融入新闻文本的主题特征、观点特征、情绪特征和欺诈特征,然后提取时序信息,并基于树集成的方法实现上市公司财务欺诈预警。本文融合预警欺诈行为的方法在CSMAR财报数据集和爬取的新浪财经数据集上达到了86.1%的准确率和86.5%的召回率,融入新闻特征和时序信息后比单纯地采用财报数据特征的准确率提高了8%。新闻文本特征可以作为财报数据的有效补充,且在财报数据和新闻文本数据中引入时序信息有利于提高上市公司财务欺诈的预警性能。 相似文献
7.
8.
从工程实际出发,介绍了在英文AutoCAD中输入汉字、修改汉字文本方法,较好地解决了AutoCAD与中文Word的图形变换,及用打印机输出大幅面纸的问题。 相似文献
9.
10.
新型冠状病毒肺炎疫情给非洲国家国际中文教育造成了重大冲击,以大国竞争为特征的大变局时代赋予国际中文教育新内涵与新使命。本文分析了后疫情时代非洲国家国际中文教育现状,基于当前非洲国家国情与国际中文教育OMO(Online-Merge-Offline,即:线上线下相融合)教育现实情况,尝试提出构建“非洲区域性国际中文教育共同体”及实施“国际中文+实用学科”职业教育人才培养模式。 相似文献
11.
12.
13.
任何出版物的版面均由文字、符号、装饰性图片组成,但最为重要的信息是来自于文字。在中文出版物中,汉字占了版面的很大比例,所以汉字的排版印刷用字对文本信息的输出是至关重要的,这就要求印刷用汉字不仅要规范,方便阅读,还要使版面更加的赏心悦目,条理清晰。 相似文献
14.
15.
吴岩 《中小企业管理与科技》2008,(9):232-233
ПpeдeдeHT(先例)一词源于拉丁语praecedens(以前的)表示“过去曾有过的现象”之意,npeдeдeHTHъIй тескт(先例文本)一词最早由俄罗斯语言学家卡拉乌罗夫(KapayЛоB)提出。先例文本(又可称先例名词),即历史上形成的某一文本,其中包含着各种不同的文化背景知识,而这些背景知识又是一个民族的知识、经验、宗教信仰、价值观念的总和,它渗透于该民族社会生活的各个方面,深深根植于该社会群体的集体潜意识中,并被社会语言集团(социолингвогруппа)的普通成员所熟悉。 相似文献
16.
利用文本分析技术,基于2015~2021年我国A股上市公司年报大样本数据,检验年报文本信息可读性对审计师行为决策的影响。研究发现,企业年报文本信息可读性越低,审计师出具非标准审计意见的概率以及审计收费越高。在由国内“十大”会计师事务所审计的企业中,企业年报文本信息可读性对审计师行为决策的影响更加显著。在控制了年报文本信息其他特征及内生性问题后,结论依然稳健。进一步研究中,对企业年报文本信息可读性影响审计师行为决策的作用机制进行了推理和检验。结果发现,审计风险和审计投入是年报文本信息可读性影响审计师行为决策的内在机理。同时,探讨和验证了企业异质性对年报文本信息可读性与审计师行为决策关系的影响,发现两者的关系在非国有企业、信息披露质量等级较高的企业中得到了缓解。 相似文献
17.
开展人工智能数据分析技术研究,研究掌握运用人工智能数据分析技术实现智能过滤短信;集成采用智能分析算法、文本挖掘、中文分词、文本搜索算法及神经网络智能分析等技术手段,自动实现对垃圾信息的准确分类过滤;建立一套科学合理和可操作性强的垃圾短信治理重要技术方案。 相似文献
18.
一、财务风险警情物元模型构建
任何事物都可用“事物、特征、量值”三个要素来加以描述,以便对事物作定性和定量分析与计算。用这三个要素组成有序三元组来描述事物的基本元,即称为物元。若以R表示物元,M表示事物,C表示事物M的特征,V(X)表示与事物特征C相应的量值,即事物M对其特征C相应量值X的隶属度,则有:R=(事物,特征,量值)=(M,c,v)。设上市公司财务风险警情测度的定量指标有111个,即为C1,C2,…Cm,以这部分指标为基础,将财务风险警情分为n个标准模式或等级,将其描述为以下的综合物元模型,也即可拓学中的“经典域”即: 相似文献
19.
20.
《北京房地产》2000,(11)
建设部 国家工商行政管理局关于印发《商品房买卖合同示范文本》的通知建住房[2000]200号各省、自治区、直辖市建委(建设厅)、工商行政管理局:根据《中华人民共和国合同法》和近几年来商品房买卖中存在的问题,建设部、国家工商行政管理局对1995年印发的《商品房购销合同示范文本》进行了修订,并更名为《商品房买卖合同示范文本)(以下简称《示范文本》)。现将《示范文本》印发给你们,并就有关问题通知如下:一、充分认识推行《示范文本》的意义,大力推广使用《示范文本》。近年来,消费者对商品房投诉较多,投诉的主要问题有:广告虚假、一房多售、面积缩水、质量低劣、延期交房、产权纠纷等。出现这些问题,有制度不健全、管理不到位的原因,也有合同不规范的原因。这些问题的出现不仅损害了消费者的合法权益,而且也将影响到住房消费热点的形成。推行《示范文本》,有利于保护当事人的合法权益,避免因合同缺款少项和当事人意思表示不真实、不确切,而出现显失公平和违法条款;有利于减少商品房买卖合同纠纷,促进合同纠纷的解决;有利于调动消费者的购房热情,促进住房消费,拉动经济增长。各地要以推行新的《示范文本》为契机,加强房地产市场管理,规范商品房销售行为,切实... 相似文献