首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
姜亮  张梅梅 《会计之友》2021,(10):37-41
当前我国税收政策更新速度快,所涉部门多,仅靠财务部门人工搜集、分析、组织实施效率低下,导致企业错失应税减税机会,因此税收政策文本的实时学习和自动分发成为加强企业应税管理、降本增效的首要任务.文章设计税政文本挖掘系统来实现税政文本自动学习和分发:首先,分析税收政策文档;其次,利用分词系统和TF-IDF算法提取每个文本的特征,用贝叶斯、决策树和随机森林三种分类器进行文本分类,并将结果与人工标注结果进行对照;最后,计算三种分类算法的混淆矩阵、准确率和召回率.实验结果表明,随机森林算法文本识别正确率最高,税政文本挖掘系统采用该算法进行识别和自动分发,据此部署部门协同工作,能显著提升公司财税管理工作的全局性和协同性.  相似文献   

2.
区域创新系统建设是深入实施国家区域发展战略、建设创新型国家的重要支撑,促进区域创新系统的协同发展有利于提高区域创新能力,实现高质量发展。从区域创新系统构成的视角构建政策编码体系,并借助Nvivo软件对北京、天津、河北及其各地级市的创新政策文本展开质性分析,通过对政策内容在不同行政层级进行横向与纵向比较,分析京津冀区域创新系统的协同性。研究发现:(1)三地的政策措施和政策目标整体上服务于“京津创新、河北转化”的功能定位;(2)三地都重视源头性的知识创新,强调人才培养、人才引进与人才福利保障;重视高新技术创新发展,立足自身产业基础形成区域高新技术创新的产业互补;(3)北京以单极发展型政策为主,天津、河北以协调互促型政策为主,北京市支持京津冀协同创新的政策比重低于天津市与河北省;(4)天津、河北以协调互促型政策为主,北京支持京津冀协同创新的政策比重低于天津与河北;(5)河北省级和各地级市的创新政策目标和政策方向具有一致性,地级市技术创新系统中的传统技术创新占比较高,与当地产业基础衔接更密切。最后,提出推动京津冀创新系统协同发展的政策建议。  相似文献   

3.
4.
近年来,财务报告附注的篇幅越来越长、信息越来越庞杂,这无疑增加了财务报告使用者的阅读难度。文本挖掘技术可以视为提炼文本中有用信息的工具,对提取财务报表附注中披露的关键信息具有很大的帮助。以文本挖掘为工具研究财务报表附注信息披露的特征,使用ROST CM软件对财务报表附注文本内容进行分词处理,经过词频统计、关键词共现分析、文本内容语义网络分析等过程发现财务报表附注披露内容的特征,探究了文本挖掘在附注研究中可以使用的技术。基于文本挖掘技术的相关研究在国内刚刚起步,财务报表附注方面更是鲜有研究,文章尝试使用文本挖掘技术来研究财务报表附注,对未来此方向的研究提供了一个可供借鉴的方法。  相似文献   

5.
通过网络爬虫技术,以微博平台的南京道路交通相关信息为舆情分析的数据来源。以交通秩序、交通事故、交通标志标线为主要舆情主题得到初始数据,筛选有效微博内容后,利用分词系统及共现矩阵分析关键词与对应关系,获取2020年南京市舆情热点话题及交通事件多发地区。剖析博文中包含城市管理、部门执法、相关政策实施等问题的相关信息。研究结果可在宏观层面了解市民关注焦点、掌握南京市道路交通发展变化。此外,还可改善现有交通现状、制定群众认可度高的交通政策。  相似文献   

6.
宋春燕 《物流科技》2024,(3):55-57+65
利用Python采集京东国际个护产品消费者的在线评论,通过文本特征分析得出“物流”、“效果”、“包装”等是影响进口跨境电商消费者满意度的关键要素。随后利用LDA主题聚类模型,结合困惑度和主题可视化,得到反映进口跨境电商服务质量的4类关键因素,包括物流效率、产品功效、感知价值和产品体验。基于此,提出改善进口跨境电商服务质量的策略。  相似文献   

7.
文章针对水利工程施工安全隐患文本的智能分类、挖掘和排查方法进行研究,提出基于机器学习和自然语言处理的方法,实现安全隐患文本的自动分类和排查线索挖掘。首先,对安全隐患文本进行预处理,提取文本特征并采用随机森林模型将文本分类为10个类别;其次,利用词云图和词频统计方法展现安全隐患的管理要点;最后,利用序列相似度匹配算法和隐含狄利克雷分布模型,从原始隐患数据中找出包含高频安全隐患核心词的代表性隐患数据,作为隐患排查线索,指导安全管理实践。文章提出的方法可以有效地提高水利工程施工安全隐患文本的分类准确率,挖掘隐患文本中有价值的信息,缩小隐患排查的范围,提高水利工程安全管理的效率和水平。  相似文献   

8.
9.
当前,科技期刊面临融合出版的挑战,截至2017年底,全国拥有科技期刊2 052种,在此现状下,科技期刊评价能促使期刊行业的健康发展。文章对文本挖掘在期刊评价的应用进行了深入探究,针对基于分类词典的文本相似度量等方法,进行了详细的分析。  相似文献   

10.
对股票市场信息的文本挖掘   总被引:1,自引:0,他引:1  
面对股票市场上海量的信息,本文提出使用文本挖掘技术,在快速得到初步挖掘结果的基础上,应用上市公司财务评价指标体系和数据挖掘中的聚类的方法对其分析。文章结合股票市场信息的特征建立了文本挖掘的框架和挖掘流程,并举用22家上市公司的年报进行文本挖掘和聚类分析,给出了一种综合分析与评价上市公司财务状况和经营状况的方法。  相似文献   

11.
为合理评价电商平台物流客户满意度情况,提出一种基于评论大数据的物流客户满意度测算方法.首先,以生鲜电商为研究对象爬取大量在线评论,进行分词等操作并基于TF-IDF算法得出生鲜电商物流满意度的关键因素及其权重,随后构建物流属性词向量模型,结合词语权重和其与物流关键因素之间的相似性,区分每句话中的物流属性,确定用户重点关注...  相似文献   

12.
文章以天猫商城智能手机产品的用户评论数据为数据源,提出基于用户评论信息的协同过滤算法优化模型,其优化核心是将评论文本中蕴含的用户偏好信息融入到经典协同过滤模型中。通过对商品、用户的多个特征属性建立商品属性特征值表,并对用户和各个商品的属性特征值间进行余弦相似度计算匹配,从而形成用户感兴趣的组合推荐。  相似文献   

13.
大数据的浪潮推动着审计技术的变革,给审计模式和审计方法都带来了巨大的改变。传统的审计数据分析方法不能对半结构化以及非结构化数据进行分析,也无法满足大数据环境下审计信息化发展的要求,亟须提出新的审计数据分析思路和方法。在此背景下,文章提出了基于文本挖掘的审计数据分析框架,并阐述了采集与存储、挖掘与分析、总结与发布详细的审计数据分析流程。通过利用文本挖掘技术对采集的非结构化原始审计数据进行挖掘,根据明确的审计需求建立不同的文本挖掘模型,对审计数据进行分析,进而发现审计疑点,最终形成可理解的审计证据和审计线索。该框架的构建旨在为大数据审计提供新的思路,以降低大数据审计风险,提高审计质量。  相似文献   

14.
文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文首先对基于空间向量模型的文本聚类过程做了较深入的讨论和总结。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已有成果的基础上,本文利用20Newsgroup文本语料库,针对向量空间表示模型,在开源的数据挖掘平台WEKA上实现了文本预处理和k-means聚类算法,并根据实际聚类效果,就文本表示、特征选择、特征降维等方面提出优化方案。  相似文献   

15.
以北京市现行1906条标准文本为研究对象,从多个维度统计分析北京市地方标准发展现状,依据标准三维空间理论构建北京市地方标准体系,运用文本挖掘方法探究北京市地方标准存在的问题。研究发现,北京市地方标准主要集中于安全、方法、管理等方面,体系维度内行业领域分布不均衡。城市基础建设及民生建设主题领域标准覆盖范围大,绿色环保、社会服务保障及数字化发展领域标准覆盖范围较小。工程、施工、交通等标准是关注的重点,绿色、智能化、养老等标准建设仍处薄弱环节。应当以法规为依托,多元主体共同参与标准制定,以滞后标准领域为导向,明确标准制定的方向。  相似文献   

16.
设计了一种基于Web的文本分类系统。系统基于文本组合特征,采用支持向量机分类器,测试结果表明系统对web文本具有较好的分类效果。  相似文献   

17.
18.
《企业技术开发》2017,(2):20-22
文章通过建立TF-IDF模型,以网络招聘信息为主要研究对象,根据处理后的数据统计得出热门领域和热门行业,并针对IT市场分析其人才需求供应情况对职位、学历层次等方面做出详细的分析。该分析方法简单客观,实际应用所形成的最终结论,对高校人才培养方案的制定和大学生职业生涯规划有较强的参照作用,以此为依据改善和修订相关专业的专业课程体系,能够提高学生的就业竞争能力。  相似文献   

19.
研究目标:构建反映行业股价走势的基于社交网络文本挖掘算法的行业投资者情绪指标,并改善嵌入行业投资者情绪指标的Black-Litterman模型对资产的配置结果。研究方法:基于社交网络文本挖掘算法度量投资者情绪,运用主成分分析法构建行业投资者情绪指标,并嵌入Black-Litterman模型中构建投资者观点矩阵,确定行业资产配置比。研究发现:基于行业投资者情绪的BL模型有效提高了资产配置的日均收益率和夏普比率。实证结果在样本外验证(除受新冠疫情影响阶段)、暴涨暴跌阶段以及经过允许卖空和交易成本调整后仍稳健,进而证实了投资者情绪对资产组合有显著影响。研究创新:基于社交网络文本挖掘算法构建投资者情绪指数,解决了仅依赖于预期收益或历史数据的预测模型无法直观揭示投资者心理认知和行为的局限性问题,从一个崭新的视角科学地解决Black-Litterman模型中投资者观点的生成问题。研究价值:扩展了Black-Litterman模型理论体系研究,并推动了行为金融理论在资产配置中的应用。  相似文献   

20.
随着大数据技术的日益成熟,以文本为对象的研究正引起学术界的重视,但目前尚处于起步阶段,有必要对文本分析技术和文献进行系统梳理。文章从文本信息来源、文本分析技术、文本特征提取、文本分析应用、国内文本分析研究现状五个维度对财务与会计领域现有文本分析技术和文献进行了详细介绍,并指出未来研究方向,有助于国内学者了解财务与会计领域文本分析研究的特征与进展,引起更多学者对财务与会计领域文本分析研究的重视。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号