Tesserocr使用时fail to init API问题解决

解决Tesserocr初始化API失败问题
在使用tesserocr时遇到'fail to init API'错误,可能由于无效的tessdata路径。尝试了添加环境变量和设置tessdata路径但仍然报错。最终解决方案是将TESSDATA_PREFIX环境变量指向'Tesseract-OCR'目录下的'tessdata'子目录,并在更改后注销或重启以使修改生效。tesserocr的版本差异可能导致路径要求不同,注意需要正确安装对应Windows系统的tesserocr版本。

Tesserocr使用时fail to init API问题解决

在初次使用tesserocr时会遇到各种问题。如fail to init API, possibly an invalid tessdata path
我这里装的是tesseract-ocr-w64-setup-v4.0.0.20181030版,python是3.7.4
尽管按网上其他教程所述,做以下两步:
1. 添加环境变量path
添加环境变量
2. 新建环境变量tessdata路径
在这里插入图片描述
此后仍然可能会报错。
信息为Failed to init API, possibly an invalid tessdata path D:\Program Files (x86)\Tesseract-OCR/

按网上其他方法各种改路径都没用。
最后将上图中tessdata路径改成D:\Program Files (x86)\Tesseract-OCR\tessdata后,终于解决。更改环境变量TESSDATA_PREFIX路径后,需要注销或重启才能使更改生效。

推测原因为tesserocr3.x对应的函数是直接在指定目录下寻找tessdata文件夹并读取里面的内容,而tesserocr4.0则需要直接指定tessdata文件夹。

比较懒,测试图片为网页上随便截图下来的文字,对我截的就是下载tesserocr的页面上的。不得不说有点坑,用pip3下载的tesserocr实际为linux的安装包,只能从网上下载用whl方式安装。windows对应的tesserocr下载地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases
识别结果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值