更新记录:
- 2024.11.2 人大高瓴长期记忆综述
文章目录
人大高瓴长期记忆综述
智能体与环境交互
- 过程通常包括三个步骤:(1)智能体从环境中获取信息存储到记忆中 (2)对存储的信息进行处理和抽取,使其更有价值 (3)根据记忆采取下一步行动
- 交互过程中,迭代的"智能体采取行动→环境给予响应→基于响应采取下一步行动",直到任务完成的过程称之为"trial"
- 示例:旅行规划和电影推荐(结合用户偏好-喜欢古建/喜欢晚上9点看电影)
记忆的来源/形式/操作
来源:(1)当前任务历史信息 (2)其他任务的信息 (3)外部知识

形式:如何表达记忆的内容,通过(1)文本 (2)参数(训练到模型里)
