paddleocr模型训练

1:下载paddleocr

develop和release分支都可以,这里以release为例

下载地址:https://github.com/PaddlePaddle/PaddleOCR

paddleocr项目结构如下

 2:跟其他框架一样,我们只需要标注好数据然后配置yml文件,就可以正常训练模型了

首先需要进行数据标注,打开自带的标注工具PPOCRLabel

cd .\PPOCRLabel\

 python .\PPOCRLabel.py --lang ch

 注意:

1:标注完成后选择文件-导出标注结果,原图和Label.txt在det训练时要用到,这个默认保存的Simpledata格式,不需要转换,只需要分割数据集

2:标注完成后选择文件-导出识别结果,分割出的文字轮廓图像和rec_gt.txt在rec训练时用到,这种需要转换,在使用icdar15数据集不需要,使用mv3时需要转为LMDB格式

3:LMDB转换

使用下述代码进行转换,

数据路径如下

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值