自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 优质实战案例分享:看DeepSeek R1如何应用到RAG,有代码

今天我们来看一个将R1的推理能力应用于RAG的应用案例。

2025-02-21 21:38:35 294

原创 Deepseek R1的应用案例,三个模板快速应用到自身任务

该项目旨在重现 DeepSeek R1训练模式,特别是用于文本到图的信息提取任务。该项目由多个部分组成,包括合成数据、监督训练和GPRO强化学习训练。训练过程分为合成数据生成、有监督训练和强化学习三个主要阶段。数据合成:基于输入文本和提取的 JSON,生成思维链有监督训练:以监督方式训练模型以进行文本到图形的提取,促使模型以正确的格式返回数据。强化学习:基于文本到图形相关的奖励函数和上述合成数据进行GRPO训练。奖励函数包括格式奖励、JSON 奖励和 F1 奖励。

2025-02-11 22:44:13 571

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除