背景说明
以前做过不少OCR识别的相关项目,基本上使用的都是使用PaddlePaddle框架来整合实现的,现在主要在做计算机视觉和视频分析这一块,所以想把以前使用过得OCR的相关知识给整合记忆一下,一方面方便自已以后查阅使用,另一方面也是对自己技术的一个总结和分享。
框架说明
PaddlePaddle(Parallel Distributed Deep Learning)是一个由百度开发的深度学习框架,官网地址飞桨PaddlePaddle-源于产业实践的开源深度学习平台,旨在为研究人员和开发者提供高效、灵活和易于使用的工具来进行深度学习模型的研究和开发。以下是PaddlePaddle的功能介绍及使用说明:
功能介绍
1.灵活性: PaddlePaddle支持静态图和动态图两种编程范式,用户可以根据需求选择合适的方式进行模型开发和调试。
2.高效性: PaddlePaddle使用高效的计算引擎,支持多卡并行训练和分布式训练,能够充分利用硬件资源加速训练过程。
3.丰富的模型库: PaddlePaddle提供了丰富的预训练模型和模型库,包括图像分类、目标检测、文本分类、语义分割等常用任务的模型,