Memory 是从**“无状态模型”到“有意识体”的中间桥梁。**
长期记忆的向量数据库设计核心:将经验语义转化为可计算的向量,并通过相似性检索实现跨场景复用。
通过结构化的经验定义、元数据设计和检索策略, Agent能从历史经验中快速学习,逐步提升决策能力这正是Agent"智能化”和"持续进化”的关键
多轮对话中的历史记忆与精准检索优化:多轮对话要在 上下文利用 与 检索纯净度 之间找到平衡
在 AI Agent 系统中,Memory 是让 Agent 保持“上下文连续性”的关键组件。
它的核心功能是让 Agent 能够“记住”过去的对话、事件、状态、偏好,从而实现个性化与长期行为一致性。
一句话总结:
Memory 是从“无状态模型”到“有意识体”的中间桥梁。
| 记忆类型 | 功能 | 存储内容 | 常见实现方式 |
|---|---|---|---|
| 🕐 短期记忆(Short-term Memory) | 保持当前对话上下文 | 最近 N 轮对话内容 | Chat History / Context Window |
| 📚 长期记忆(Long-term Memory) | 记住长期事实、用户偏好 | 用户档案、知识点、历史记录 | 向量数据库 + Embedding 检索 |
| ⚙️ 工作记忆(Working Memory) | 临时任务状态 | 当前任务目标、步骤、变量 | Runtime Cache / 内存 |
| 🧭 情景记忆(Episodic Memory) | 记录事件、经历 | “我曾在10月帮用户写过简历” | RAG 知识片段 + 日志系统 |

<aside> 💡
核心回答三个问题:存什么?怎么存?怎么查?
存什么(经验内容)
将过往交互中的关键信息(用户反馈、执行过程、结果说明等)抽取出来。 这些内容经过语义向量化,成为长期记忆的“知识单元”。
怎么存(存储方式)
除了内容本身,还需要给经验打上元数据标签。 常见的元数据包括:所属场景(scene)、时间戳(timestamp)、优先级(priority)等。这样不仅能按语义找,还能结合场景或时间等条件进行过滤。
怎么查(检索方式) 输入新的 query 后,先通过语义相似度匹配可能的历史经验。 然后再结合元数据进行二次过滤和排序,例如优先选择近期且用户反馈较好的经验。最终把结果作为上下文输入到LLM中,帮助智能体做更合理的推理和决策。 </aside>
将用户关键信息实时/异步写入系统提示词中。