今天给大家分享一个Java实现OCR(图片转文字)的方法。
具体实现是把tess4j整合到一个SpringBoot项目中。
下面是详细步骤
什么是Tess4j
在实现OCR之前,先要分清楚Tesseract和Tess4j的区别。
Tesseract是一个开源的光学字符识别(OCR)引擎,它可以将图像中的文字转换为计算机可读的文本。支持多种语言和书面语言,并且可以在命令行中执行。它是一个流行的开源OCR工具,可以在许多不同的操作系统上运行。
Tess4J是一个基于Tesseract OCR引擎的Java接口,可以用来识别图像中的文本,说白了,就是封装了它的API,让Java可以直接调用。
Tesseract引擎的下载
根据上面介绍的,Tess4j只是提供OCR的Java接口,真正OCR的Tesseract引擎。所以我们得先下载对应系统的Tesseract引擎(这里我以Windows版本为例)。
下载地址【github.com/UB-Mannheim…】
下载完成之后选择安装路径,默认安装即可。