如何训练LLM实现聊天记忆

ZhangJiQun&MXP

于 2025-08-26 20:08:13 发布

阅读量12

点赞数 1

CC 4.0 BY-SA版权

分类专栏：教学 2021 AI python 2024大模型以及算力文章标签：人工智能算法前端 transformer 机器学习服务器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38998213/article/details/150868032

教学同时被 3 个专栏收录

1898 篇文章 ¥199.90 ¥299.90

订阅专栏

1486 篇文章 ¥199.90 ¥299.90

订阅专栏

2024大模型以及算力

1297 篇文章 ¥199.90 ¥299.90

订阅专栏

训练具备记忆能力的LLM（大语言模型）时，输入、输出和标签的设计需围绕“对话历史+当前查询”与“关联历史的回复”展开，

核心是让模型学习“如何基于过去的对话信息生成连贯回复

一、输入（Input）：包含记忆信息的对话上下文

输入是多轮对话历史+当前查询的结构化组合，目的是让模型“看到”需要记忆的信息（如用户名字、偏好、前文提到的细节）。

关键要素：

角色区分：明确标注“用户”和“助手”的发言（避免模型混淆角色）；
时序关系：按对话顺序排列（确保模型理解“先发生什么，后发生什么”）；
记忆点嵌入：包含需要模型记住的关键信息（如用户名字、提到的事件、偏好等）。

示例（格式化前的原始输入）：

[
  {
   
   "role": "user"

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

ZhangJiQun&MXP 等到80岁回首依旧年轻

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。