设为首页收藏本站
我的广告
     
切换到窄版

 找回密码
 立即注册
薅羊毛,扫我就赚了!
查看: 251|回复: 0

[单文件] PDF电子发票数据提取至Excel

[复制链接]

  离线 

  • 打卡等级:女儿国探花
  • 打卡总天数:321
  • 打卡月天数:0
  • 打卡总奖励:4631
  • 最近打卡:2025-05-14 06:38:05

973

主题

24

回帖

1万

积分

版主

积分
15742
发表于 2024-4-13 15:53:04 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:0  参与人数:0  我的评分:未评

11.jpg


采用python正则表达提取
支持电子发票和数电发票,不支持图片和图片形式的PDF,不支持OFD


目前可能会有以下问题:
1、在win10环境上打包的,win7系统可能不支持。
2、增加了一些非公司后缀的正则式,但是还是会存有一定误差,楼主的100多张发票已经能够正确识别了。
3、非数电发票的备注识别可能会识别不出。
4、没有测试过带清单的发票。

使用场景:
1、避免电子发票重复报销入账(筛选发票号码或者校验码重复值)
2、检查收到的发票纳税人名称和纳税人识别号是否正确
3、根据路径筛选统计报销人电子发票金额(前提:依据报销人将发票分别存入文件夹)
4、OFD文件可以用数科OFD阅读器批量转换成pdf再统一提取


软件下载: PDF电子发票识别提取1.7.exe (21.93 MB, 下载次数: 0, 售价: 30 金币)
女儿国免责声明
1、本主题所有言论和图片纯属会员个人意见,与本论坛立场无关
2、本站所有主题由该帖子作者发表,该帖子作者与女儿国享有帖子相关版权
3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和女儿国的同意
4、帖子作者须承担一切因本文发表而直接或间接导致的民事或刑事法律责任
5、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责
6、本站所有带作者名的小说均收集于网络,版权归原作者所有,本站只提供整理校对排版
7、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意
8、女儿国管理员和版主有权不事先通知发贴者而删除本文
贡献值排行榜:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|《女儿国小说网》

GMT+8, 2025-7-6 05:36 , Processed in 0.234429 second(s), 44 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表