OCRFlux-3B是由齐思(MiraclePlus)团队联合开发的开源多模态OCR工具 ,基于3B参数规模的大语言模型构建,专注于将PDF文档和图像高效转换为结构清晰、可读性强Markdown文本 。该模型与OCRFlux工具包深度集成,支持通过vLLM框架实现高效推理,特别适用于需要处理海量文档的场景,如学术研究、金融报告解析及法律文书归档。
核心功能
- 多模态文档解析
- 支持多种输入格式
- 多语言识别
- 高效精准的文本提取
- 准确率突破96.7%
- 跨页表格合并
- 开源与本地化部署
- 低硬件门槛
GitHub:https://github.com/chatdoc-com/OCRFlux
【OCRFlux-3B】模型已经在趋动云『社区项目』上线,无需自己创建环境、下载模型,一键即可快速部署,快来体验 【OCRFlux-3B】带来的精彩体验吧!
项目入口
视频教程
云平台一键部署【OCRFlux】轻量高效的开源OCR新标杆_哔哩哔哩_bilibili
启动开发环境
进入【OCRFlux-3B】项目主页中,点击运行一下
,将项目一键克隆至工作空间,『社区项目』推荐适用的算力规格,可以直接立即运行
,省去个人下载数据、模型和计算算力的大量准备时间。
配置完成,点击进入开发环境
,根据主页项目介绍进行部署。
使用方法
在gemini/code中找到使用说明,选中使用样例单元格,点击运行,等待生成local URL,右侧添加端口7680。
示例展示
PDF文件示例
图片识别示例
➫温馨提示: 完成项目后,记得及时关闭开发环境,以免继续产生费用!
趋动云新客专享活动(限时有效)做任务净得190元算力金,点击下方 海报了解活动详情,完成任务的小伙伴添加下方小助手提供完成截图领取赠送算力金。
智汇全球,趋动未来
『社区项目』汇聚全球智慧,是促进技术交流的宝贵平台,期待每一位AI爱好者体验一键部署功能的强大魅力。
同时,我们也热切盼望每一位码友加入,分享您的精品作品,共筑这个充满活力与创新的技术乐园。