Al Agent 的 Memory记忆存储设计

Memory 是从**“无状态模型”到“有意识体”的中间桥梁。**

长期记忆的向量数据库设计核心:将经验语义转化为可计算的向量,并通过相似性检索实现跨场景复用。

通过结构化的经验定义、元数据设计和检索策略, Agent能从历史经验中快速学习,逐步提升决策能力这正是Agent"智能化”和"持续进化”的关键

多轮对话中的历史记忆与精准检索优化：多轮对话要在上下文利用与检索纯净度之间找到平衡

🧠 一、什么是 Memory（记忆）

在 AI Agent 系统中，Memory 是让 Agent 保持“上下文连续性”的关键组件。

它的核心功能是让 Agent 能够“记住”过去的对话、事件、状态、偏好，从而实现个性化与长期行为一致性。

一句话总结：

Memory 是从“无状态模型”到“有意识体”的中间桥梁。

记忆类型	功能	存储内容	常见实现方式
🕐 短期记忆（Short-term Memory）	保持当前对话上下文	最近 N 轮对话内容	Chat History / Context Window
📚 长期记忆（Long-term Memory）	记住长期事实、用户偏好	用户档案、知识点、历史记录	向量数据库 + Embedding 检索
⚙️ 工作记忆（Working Memory）	临时任务状态	当前任务目标、步骤、变量	Runtime Cache / 内存
🧭 情景记忆（Episodic Memory）	记录事件、经历	“我曾在10月帮用户写过简历”	RAG 知识片段 + 日志系统

<aside> 💡

核心回答三个问题:存什么?怎么存?怎么查?

存什么（经验内容）

将过往交互中的关键信息(用户反馈、执行过程、结果说明等)抽取出来。这些内容经过语义向量化，成为长期记忆的“知识单元”。
怎么存（存储方式）

除了内容本身,还需要给经验打上元数据标签。 常见的元数据包括：所属场景（scene)、时间戳（timestamp)、优先级（priority)等。这样不仅能按语义找,还能结合场景或时间等条件进行过滤。
怎么查(检索方式) 输入新的 query 后，先通过语义相似度匹配可能的历史经验。然后再结合元数据进行二次过滤和排序，例如优先选择近期且用户反馈较好的经验。最终把结果作为上下文输入到LLM中,帮助智能体做更合理的推理和决策。 </aside>

将用户关键信息实时/异步写入系统提示词中。