# python图片转文字的方法有那些

最新推荐文章于 2025-06-14 16:25:23 发布

段子手-168

最新推荐文章于 2025-06-14 16:25:23 发布

阅读量318

点赞数 3

CC 4.0 BY-SA版权

分类专栏： Python 文章标签： python 开发语言 OCR pytesseract pillow API key

本文链接：https://blog.csdn.net/qfyh_djh/article/details/147230650

Python 专栏收录该内容

62 篇文章

订阅专栏

python图片转文字的方法有那些

在 Python 里，图片转文字通常借助 OCR（光学字符识别）技术达成。下面为你介绍几种常见的实现方法：

一、使用python 的pytesseract库

pytesseract是一个 Python 封装的 Tesseract OCR 引擎，可用来识别图片中的文字。你要先安装 Tesseract OCR 引擎，再安装pytesseract库。

1、安装依赖

pip install pytesseract pillow

在这里插入图片描述

2、示例代码

# 图片转文字：imgtotext.py

import pytesseract
from PIL import Image

try:
    # 设置Tesseract OCR的路径（如果需要）
    pytesseract.pytesseract.tesseract_cmd = r'D:\Program Files\Tesseract-OCR\tesseract.exe'

    # 打开图片
    image = Image.open('example.jpg')

    # 进行OCR识别
    text = pytesseract.image_to_string(image, lang='chi_sim+eng')

    print(text)

except FileNotFoundError:
    print("错误：未找到指定的图片文件，请检查文件路径。")
except pytesseract.TesseractNotFoundError:
    print("错误：未找到Tesseract OCR可执行文件，请检查路径设置。")
except Exception as e:
    print(f"发生未知错误：{e}")

在这里插入图片描述

二、使用百度 AI 开放平台的 OCR 服务

百度 AI 开放平台提供了强大的 OCR 服务，具备高精度、多语言支持等特点。你需要先在百度 AI 开放平台创建应用，获取 API Key 和 Secret Key。

1、安装依赖

pip install baidu-aip

2、示例代码

# 使用百度 AI 开放平台的 OCR 服务，使图片转文字

from aip import AipOcr

# 设置你的APPID/AK/SK
APP_ID = 'your_app_id'
API_KEY = 'your_api_key'
SECRET_KEY = 'your_secret_key'

# 初始化AipOcr对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片def get_file_content(file_path):
    with open(file_path, 'rb') as fp:
        return fp.read()

image = get_file_content('example.jpg')

# 调用通用文字识别接口
result = client.basicGeneral(image)

# 提取识别结果
if 'words_result' in result:
    text = '\n'.join([item['words'] for item in result['words_result']])
    print(text)

三、使用阿里云 OCR 服务

阿里云同样提供了 OCR 服务，拥有丰富的识别场景和高精度的识别能力。你需要在阿里云控制台创建 OCR 服务实例，获取 Access Key ID 和 Access Key Secret。

1、安装依赖

pip install aliyun-python-sdk-core aliyun-python-sdk-ocr

2、示例代码

from aliyunsdkcore.client import AcsClient
from aliyunsdkocr.request.v20191230.RecognizeGeneralRequest import ecognizeGeneralRequest
import json

# 设置你的Access Key ID和Access Key Secret
access_key_id = 'your_access_key_id'
access_key_secret = 'your_access_key_secret'
region_id = 'cn-hangzhou'

# 初始化AcsClient对象
client = AcsClient(access_key_id, access_key_secret, region_id)

# 创建请求对象
request = RecognizeGeneralRequest()
request.set_accept_format('json')

# 读取图片
with open('example.jpg', 'rb') as f:
    image_content = f.read()

# 设置请求参数
request.set_ImageURL('')
request.set_ImageContent(image_content)

# 发起请求
response = client.do_action_with_exception(request)

# 解析响应结果
result = json.loads(response)if 'Data' in result and 'Text' in result['Data']:
    text = result['Data']['Text']
    print(text)