吊打一切现有开源OCR项目：效果再升7%，速度提升220%

百度_开发者中心

于 2021-09-08 11:21:01 发布

阅读量300

点赞数

CC 4.0 BY-SA版权

分类专栏：百度开源文章标签：人工智能机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41888295/article/details/120175846

01 导读

OCR 方向的工程师，之前一定听说过 PaddleOCR 这个项目，其主要推荐的 PP-OCR 算法更是被国内外企业开发者广泛应用。短短半年时间，累计 Star 数量已超过15k，频频登上 Github Trending 和 Paperswithcode 日榜月榜第一。

在《Github 2020数字洞察报告》中被评为中国 Github Top 20活跃项目，
称它为 OCR 方向目前最火的 repo 绝对不为过。

最近，由 PaddleOCR 原创团队，针对 PP-OCR 进行了一些经验性改进，构建了一种新的 OCR 系统，称为 PP-OCRv2。

从算法改进思路上看，主要有五个方面的改进：

1.检测模型优化：采用 CML 协同互学习知识蒸馏策略；
2.检测模型优化：CopyPaste 数据增广策略；
3.识别模型优化：LCNet 轻量级骨干网络；
4.识别模型优化：UDML 改进知识蒸馏策略；
5.识别模型优化：Enhanced CTC loss 损失函数改进。

从效果上看，主要有三个方面提升：

1.在模型效果上，相对于 PP-OCR mobile 版本提升超7%；
2.在速度上，相对于 PP-OCR server 版本提升超过220%；
3.在模型大小上，11.6M 的总大小，服务器端和移动端都可以轻松部署。

在这里插入图片描述

GitHub 项目:
https://github.com/PaddlePaddle/PaddleOCR
注：为了照顾刚了解 PaddleOCR 的新用户，在第二、三部分简单进行一些背景介绍，熟悉 PaddleOCR 的老用户可以直接跳到第四部分。

02 PaddleOCR 历史表现回顾

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。