Memory 是从**“无状态模型”到“有意识体”的中间桥梁。**

长期记忆的向量数据库设计核心:将经验语义转化为可计算的向量,并通过相似性检索实现跨场景复用。

通过结构化的经验定义、元数据设计和检索策略, Agent能从历史经验中快速学习,逐步提升决策能力这正是Agent"智能化”和"持续进化”的关键

多轮对话中的历史记忆与精准检索优化:多轮对话要在 上下文利用 与 检索纯净度 之间找到平衡

🧠 一、什么是 Memory(记忆)

在 AI Agent 系统中,Memory 是让 Agent 保持“上下文连续性”的关键组件

它的核心功能是让 Agent 能够“记住”过去的对话、事件、状态、偏好,从而实现个性化与长期行为一致性。

一句话总结:

Memory 是从“无状态模型”到“有意识体”的中间桥梁。

🧩 二、Memory 的四种类型(按时间尺度)

记忆类型 功能 存储内容 常见实现方式
🕐 短期记忆(Short-term Memory) 保持当前对话上下文 最近 N 轮对话内容 Chat History / Context Window
📚 长期记忆(Long-term Memory) 记住长期事实、用户偏好 用户档案、知识点、历史记录 向量数据库 + Embedding 检索
⚙️ 工作记忆(Working Memory) 临时任务状态 当前任务目标、步骤、变量 Runtime Cache / 内存
🧭 情景记忆(Episodic Memory) 记录事件、经历 “我曾在10月帮用户写过简历” RAG 知识片段 + 日志系统

image.png

三、多轮对话中让AI保持长期记忆的优化方式

<aside> 💡

长期记忆的关键设计要素

核心回答三个问题:存什么?怎么存?怎么查?

  1. 存什么(经验内容)

    将过往交互中的关键信息(用户反馈、执行过程、结果说明等)抽取出来。 这些内容经过语义向量化,成为长期记忆的“知识单元”。

  2. 怎么存(存储方式)

    除了内容本身,还需要给经验打上元数据标签。 常见的元数据包括:所属场景(scene)、时间戳(timestamp)、优先级(priority)等。这样不仅能按语义找,还能结合场景或时间等条件进行过滤。

  3. 怎么查(检索方式) 输入新的 query 后,先通过语义相似度匹配可能的历史经验。 然后再结合元数据进行二次过滤和排序,例如优先选择近期且用户反馈较好的经验。最终把结果作为上下文输入到LLM中,帮助智能体做更合理的推理和决策。 </aside>

(1) System Prompt存储法

将用户关键信息实时/异步写入系统提示词中。