目录
欢迎大家来到本次的技术分享,今天我们将探讨如何结合PaddlePaddle和OpenVINO,打造一个指哪读哪的AI“点读机”。这款“点读机”能够在你指向文字的时候自动进行阅读,非常适合语言学习、快速浏览文档或帮助视力障碍者阅读。
项目简介与构想
“点读机”是我们小时候学习语言的好帮手,现在,我们希望通过最新的AI技术,将“点读机”升级到新的水平。具体来说,我们将通过一个简单的摄像头,结合深度学习模型,实现一个能够识别你手指所指向的文本,并将其读出来的系统。
这个项目的核心技术包括两部分:一是文本检测与识别,二是语音合成。我们将使用PaddlePaddle进行深度学习模型的训练和部署,然后使用OpenVINO来进行模型的优化和加速。
0 背景介绍
现下,随着各种流行APP的出现,“听书”已经成为一种新的读书方式。不过,相比起电子书软件,要从实体书本中“听书”,就存在不少困难。
比如,电子书软件天然就有准确的文本输入,只需要解决语音合成问题——当然,这看似简单的一步,其实一点也不简单,比如要做好分词、断句,语音合成模型需要在海量数据集上训练等等