首页 | 本学科首页   官方微博 | 高级检索  
     

利用Python技术批量提取文档数据
作者姓名:魏炎  孙畅
作者单位:1. 荆州市审计局;2. 咸宁市咸安区审计局
摘    要:<正>当审计中遇到同一模板创建的多份Word文档时,利用Python技术从Word文档中批量提取数据,可极大地提高审计效率。本文以某乡镇近三年的房屋拆迁补偿安置数据为例,探讨该办法的具体应用。一、案例背景本案例中原始数据分布在70个文件夹中,每个文件夹包含某时段的协议书(拓展名为doc)及相关附件(拓展名为pdf或xlsx)。分析后初步判断70份协议书为同一模板创建的文档(节选如下图1所示)。

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号