你的Agent记性差?问题根本不在"记不住"
Site Owner
发布于 2026-05-20
为什么你的Agent记忆系统总是跑偏?本文揭示Memory的四个建模对象、三条核心链路,以及为什么遗忘能力比存储能力更重要。

你的Agent记性差?问题根本不在"记不住"
大多数人在错误的地方找答案。
一个数据分析Agent,第1次会话知道你偏好Plotly,第5次推断出你真正关注留存率而非DAU,第20次判断你的汇报对象是个重视ROI叙事的VP——这三层理解,每一层都需要不同的时间尺度才能浮现。
没有记忆系统,Agent永远只能做第1次会话的事。
听起来很简单对吧?但当你真正去构建这个"记忆系统"的时候,会发现一个让人窒息的事实:几乎所有团队的第一版设计,从根上就跑偏了。
你以为在造记忆,其实只是在造垃圾箱
"Memory不就是把聊天记录存起来,加上向量检索吗?"
这句话我听过太多次。每次听到我都很想问:你上次用这种逻辑造出来的系统,现在还能用吗?
RAG(Retrieval-Augmented Generation)本质上是把外部知识源中相关的内容检索出来,注入当前上下文。它解决的是"模型不知道,但资料库里有"的问题。
但Memory要处理的,是另一件完全不同的事:系统如何在时间中维持连续性、更新自我理解、并且不被自己的过去拖死。
换句话说,Memory的核心不是"把过去留下来",而是治理过去如何进入现在。
当用户说"今天是我生日",RAG只会去搜索"生日"这个语义;Memory则已经知道你的偏好、禁忌、习惯和上下文变化,并把它们带进当前回应。
一个只会累积而不会整理的系统,早晚会被自己的过去压垮。这不是预测,是定律。
四层模型:为什么单一记忆系统注定失败
很多人以为记忆就是"记住用户偏好"。这个方向没错,但只覆盖了四分之一。
面向工程实现,Agent的记忆可以分成四层:
第一层:用户模型。 偏好、风险偏好、沟通习惯、决策模式。用户从"抵触TypeScript"到"逐渐接受"再到"主动要求重写"——这个转变轨迹本身就是高价值信号。
第二层:任务模型。 哪些方案被否决过,哪些结论已确认,哪些artifact是当前真版本,哪些承诺还没完成。很多Agent失败不是不懂你,而是不记得事情已经推进到了哪一步。
第三层:世界模型。 操作环境:仓库结构、API约束、系统边界、组织规则、数据新鲜度。大量"个性化错误"本质上不是没记住你,而是没记住你所在的环境已经变了。
第四层:自我模型。 试过什么、哪条路径失败过、哪个工具在什么场景下不稳定、哪些推断只是暂定假设。没有这层记忆,Agent不是在学习,只是在重复犯错。
意图不是被单独存在某个字段里的东西。它是这四层模型长期耦合后浮现出来的上层能力——就像一个跟了你三年的助理,他"懂你"不是因为背了一本偏好手册,而是因为他同时理解你的脾气、你的项目进度、你的组织环境和他自己的能力边界。
单一维度的记忆系统,无论做得多精细,在根本上就是残缺的。