paddleocr模型训练

now()

已于 2022-11-23 11:54:26 修改

阅读量5.4k

点赞数 3

CC 4.0 BY-SA版权

文章标签： python 人工智能深度学习

于 2022-10-31 13:24:58 首次发布

本文链接：https://blog.csdn.net/GZ_public/article/details/127613203

1：下载paddleocr

develop和release分支都可以，这里以release为例

下载地址：https://github.com/PaddlePaddle/PaddleOCR

paddleocr项目结构如下

2：跟其他框架一样，我们只需要标注好数据然后配置yml文件，就可以正常训练模型了

首先需要进行数据标注,打开自带的标注工具PPOCRLabel

cd .\PPOCRLabel\

python .\PPOCRLabel.py --lang ch

注意：

1：标注完成后选择文件-导出标注结果，原图和Label.txt在det训练时要用到，这个默认保存的Simpledata格式，不需要转换，只需要分割数据集

2：标注完成后选择文件-导出识别结果，分割出的文字轮廓图像和rec_gt.txt在rec训练时用到，这种需要转换，在使用icdar15数据集不需要，使用mv3时需要转为LMDB格式

3：LMDB转换

使用下述代码进行转换，

数据路径如下

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

now()

关注关注

3
点赞
踩
33

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

PaddleOCR 自制模型训练

Rey的技术博客

09-19

3161

拿文字识别场景举例：文字识别也是图像领域一个常见问题。然而，对于自然场景图像，首先要定位图像中的文字位置，然后才能进行识别。文字检测：解决的问题是哪里有文字，文字的范围有多少文字识别：对定位好的文字区域进行识别，主要解决的问题是每个文字是什么，将图像中的文字区域进转化为字符信息。

PaddleOCR训练自己的数据集（中英文）（全套）和C#部署（半套）

qq_65356682的博客

06-25

3945

PaddleOCR是一个基于飞桨开发的OCR（Optical Character Recognition，光学字符识别）系统。其技术体系包括文字检测、文字识别、文本方向检测和图像处理等模块。以下是其优点：高精度：PaddleOCR采用深度学习算法进行训练，可以在不同场景下实现高精度的文字检测和文字识别。多语种支持：PaddleOCR支持多种语言的文字识别，包括中文、英文、日语、韩语等。同时，它还支持多种不同文字类型的识别，如手写字、印刷体、表格等。

2 条评论您还未登录，请先登录后发表或查看评论

PaddleOCR-v4模型训练教程

m0_74386238的博客

11-25

3806

请注意，你的train_data目录结构需要与我一样，如图：！请注意，数据集中不应该出现中文命名！打开下载好的2.6版本，在此2.6的目录下创建一个空文件夹“train_data”，还有一件事，最开始的初步识别也可能出现这个问题，故请仔细检查每一个识别结果。右键未识别处，在弹出菜单中选择“矩形标注”或者“多点标注”，操作鼠标标注。还有一件事，记得查看右边的识别结果，是否正确，有可能识别错误，请自行修正。在标记完所有的数据之后，最后一步，导出“标记结果”和“识别结果”。安装PPOCRLabel。

使用PaddleOCRv4训练自己的数据集（项目实践教程）

最新发布

大家好，我是阿彬，专注于机器视觉中的细节之美与技术之道

06-10

1024

本文介绍了基于PaddleOCRv4的证件OCR技术开发全流程。首先概述了证件OCR技术原理和应用场景，以及PaddleOCRv4模型的特点。接着详细讲解了环境搭建（Python、PaddlePaddle和PaddleOCR安装）、数据准备（红外证件图像采集与预处理）、数据标注（使用PPOCRLabel工具）等准备工作。然后重点阐述了文字检测模型和识别模型的训练方法，包括预训练模型选择、配置文件修改、训练启动及测试评估。最后介绍了模型静态图导出和部署流程。该教程完整呈现了从数据准备到模型部署的证件OCR开发

paddleOcr训练一个属于自己的模型

m0_49710816的博客

11-10

8645

训练一个属于自己的paddleocr模型，从环境搭建到模型推理全过程

PaddleOCR模型训练及使用详细教程

Elaine的博客

01-25

1万+

PaddleOCR是基于PaddlePaddle深度学习框架的开源OCR工具，但它提供了推理模型/训练模型/预训练模型，用户可以直接使用推理模型进行识别，也可以对训练模型或预训练模型进行再训练。支持约80种语言的文本识别，并具有较高的准确性和速度。

PadleOCR训练自己的ocr模型之训练步骤

m0_63493883的博客

06-26

1万+

一、前期准备1、代码2、标注工具二、环境配置库的安装：在文件配置完后，训练后时看缺什么库就安什么库三、文件配置。

PaddleOCR使用笔记之模型训练

greatwind的博客

09-28

9399

简介 PaddleOCR算法主要包含三个部分，分别是文本检测模型(detection)、文本识别模型(recognition)、方向分类器(classification)。文本检测模型(detection) 模型介绍 PaddleOCR开源的文本检测算法列表： DB(paper) [2]（ppocr推荐） EAST(paper)[1] SAST(paper)[4] 在ICDAR2015文本检测公开数据集上，算法效果如下：模型骨干网络 precision recall Hmean

PaddleOCR模型训练

07-27

关于PaddleOCR模型的训练，您可以按照以下步骤进行： 1. 数据准备：收集并准备训练数据集，包括带有标注的图像和对应的文本标签。 2. 安装PaddlePaddle：确保您已经安装了PaddlePaddle深度学习框架，可以使用pip或...

paddleocr模型训练需要多久

05-10

### PaddleOCR模型训练时间的影响因素 PaddleOCR 是一种用于光学字符识别 (OCR) 的开源工具包，其训练时间和效率受到多种因素影响。以下是主要影响因素及其解释： #### 1. 数据集规模数据集的大小直接影响训练...

PaddleOCR训练属于自己的模型详细教程（从打标，制作数据集，训练到应用，以行驶证识别为例）

热门推荐

qq_52852432的博客

07-25

10万+

使用最新的paddlepaddle进行训练和保存模型

02-28

百度paddleocr训练详解

06-04

paddleocr是基于paddlepaddle的一个图文识别项目，为了对自己的数据进行标注训练，所以写了详细的步骤文档，感觉没看到有比我这份文档更加详细的了，不过可惜的是，因为我的硬盘不够大，训练部分无法完成，所以只到了训练的步骤。本来还想用那个c#实例来试试训练结果的。主要是做个记录，所以积分限定死了一分，不允许动态调分，用得上的同学尽管拿去看

paddleocr文本识别模型的训练

didiaopao的博客

10-20

1万+

1、准备数据训练自己的模型首先要有数据集，在我写的《paddleocr文本检测模型的训练》这篇文章的时候我已经提供了一份数据集，里面包含了文本检测和识别的数据集，由于那篇文章是文本检测的训练，所以只用到了文本检测的数据集，这里我用的是文本识别的数据集，有需要数据的可以去那篇文章里面找数据。文章链接。让我们来直观的感受一下数据集，数据集照片的图片如下所示：数据的标签如下图所示，就是每行的前面是图片的路径，后面为该图片的标签内容。这里要注意的是：txt文件中默...

PaddleOCR学习（二）PaddleOCR检测模型训练

weixin_42708301的博客

08-23

9387

这一部分主要介绍，如何使用自己的数据库去训练PaddleOCR的文本检测模型。官方教程https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/detection.md 一、准备训练数据首先你需要有自己的数据，如果没有自己的数据，推荐使用ICDAR2015的数据库，上网搜即可找到，内含1000个训练样本和500个测试样本，包括图片与标准数据（txt格式）。如何标注自己的数据大家可以自行去网上搜索一下，PaddleOCR自带标注工

2_paddleOCR训练自己的模型

Stefan的博客

12-05

8489

目录 1 下载工具安装及使用... 1 1.1 下载迅雷... 1 1.2 使用迅雷下载文件... 1 2 文本检测模型... 2 2.1 资料准备... 2 2.1.1 下载数据集... 2 2.1.2 下载标注文件... 2 2.1.3 组织数据集路径... 3 2.2 开始训练... 3 2.2.1 下载预训练模型... 3 2.2.2 组织预训练模型路径... 3 ...

2024年最新新手掌握PaddleOCR使用（训练自己数据集与知识蒸馏）

hsling

09-11

1万+

PaddleOCR：文本检测/识别模型训练、模型推理实操

lythinking的博客

05-07

3713

🚀🌟基于（实用的超轻量级OCR系统，支持80多种语言识别，提供数据标注和合成工具，支持在服务器、移动、嵌入式和物联网设备之间训练和部署）

使用PaddleOCR模型训练自定义数据集

147.258.369

03-20

2997

以训练集为例：建议将训练图片放入同一个文件夹，并用一个txt文件（train_list.txt）记录图片路径和标签，txt文件里的内容如下:注意： txt文件中默认请将图片路径和图片标签用 \t 分割，如用其他方式分割将造成训练报错。