基于文本挖掘的税政自动识别与分发系统研究 |
| |
引用本文: | 姜亮,张梅梅.基于文本挖掘的税政自动识别与分发系统研究[J].会计之友,2021(10):37-41. |
| |
作者姓名: | 姜亮 张梅梅 |
| |
作者单位: | 国网河北省电力公司电力科学研究院;华北电力大学经济管理系 |
| |
基金项目: | 河北省软科学项目"双螺旋结构的数字农业研究——乡村振兴新动能" |
| |
摘 要: | 当前我国税收政策更新速度快,所涉部门多,仅靠财务部门人工搜集、分析、组织实施效率低下,导致企业错失应税减税机会,因此税收政策文本的实时学习和自动分发成为加强企业应税管理、降本增效的首要任务.文章设计税政文本挖掘系统来实现税政文本自动学习和分发:首先,分析税收政策文档;其次,利用分词系统和TF-IDF算法提取每个文本的特征,用贝叶斯、决策树和随机森林三种分类器进行文本分类,并将结果与人工标注结果进行对照;最后,计算三种分类算法的混淆矩阵、准确率和召回率.实验结果表明,随机森林算法文本识别正确率最高,税政文本挖掘系统采用该算法进行识别和自动分发,据此部署部门协同工作,能显著提升公司财税管理工作的全局性和协同性.
|
关 键 词: | 随机森林 部门协同 税政文本 |
本文献已被 万方数据 等数据库收录! |
|