Python实现发票信息识别

一、安装所需要的python库

pip3 install fitz -i https://pypi.tuna.tsinghua.edu.cn/simple
pip3 install PyMuPDF -i https://pypi.tuna.tsinghua.edu.cn/simple
pip3 install paddleocr -i https://pypi.tuna.tsinghua.edu.cn/simple
pip3 install paddlepaddle -i https://mirror.baidu.com/pypi/simple

二、所需提取的内容

发票号码
开票日期
销售方名称
销售方纳税人识别号
金额

import fitz
from paddleocr import PaddleOCR
from openpyxl import load_workbook

pdf = fitz.open('test.pdf')
page = pdf.load_page(0)  # 获取第0页
# 提高分辨率
pix = page.get_pixmap()
zoom_x = 8
zoom_y = 8
mat = fitz.Matrix(zoom_x, zoom_y)
pix = page.get_pixmap
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值