你的Agent记性差？问题根本不在"记不住"

大多数人在错误的地方找答案。

一个数据分析Agent，第1次会话知道你偏好Plotly，第5次推断出你真正关注留存率而非DAU，第20次判断你的汇报对象是个重视ROI叙事的VP——这三层理解，每一层都需要不同的时间尺度才能浮现。

没有记忆系统，Agent永远只能做第1次会话的事。

听起来很简单对吧？但当你真正去构建这个"记忆系统"的时候，会发现一个让人窒息的事实：几乎所有团队的第一版设计，从根上就跑偏了。

你以为在造记忆，其实只是在造垃圾箱

"Memory不就是把聊天记录存起来，加上向量检索吗？"

这句话我听过太多次。每次听到我都很想问：你上次用这种逻辑造出来的系统，现在还能用吗？

RAG（Retrieval-Augmented Generation）本质上是把外部知识源中相关的内容检索出来，注入当前上下文。它解决的是"模型不知道，但资料库里有"的问题。

但Memory要处理的，是另一件完全不同的事：系统如何在时间中维持连续性、更新自我理解、并且不被自己的过去拖死。

换句话说，Memory的核心不是"把过去留下来"，而是治理过去如何进入现在。

当用户说"今天是我生日"，RAG只会去搜索"生日"这个语义；Memory则已经知道你的偏好、禁忌、习惯和上下文变化，并把它们带进当前回应。

一个只会累积而不会整理的系统，早晚会被自己的过去压垮。这不是预测，是定律。

很多人以为记忆就是"记住用户偏好"。这个方向没错，但只覆盖了四分之一。

面向工程实现，Agent的记忆可以分成四层：

第一层：用户模型。 偏好、风险偏好、沟通习惯、决策模式。用户从"抵触TypeScript"到"逐渐接受"再到"主动要求重写"——这个转变轨迹本身就是高价值信号。

第二层：任务模型。 哪些方案被否决过，哪些结论已确认，哪些artifact是当前真版本，哪些承诺还没完成。很多Agent失败不是不懂你，而是不记得事情已经推进到了哪一步。

第三层：世界模型。 操作环境：仓库结构、API约束、系统边界、组织规则、数据新鲜度。大量"个性化错误"本质上不是没记住你，而是没记住你所在的环境已经变了。

第四层：自我模型。 试过什么、哪条路径失败过、哪个工具在什么场景下不稳定、哪些推断只是暂定假设。没有这层记忆，Agent不是在学习，只是在重复犯错。

意图不是被单独存在某个字段里的东西。它是这四层模型长期耦合后浮现出来的上层能力——就像一个跟了你三年的助理，他"懂你"不是因为背了一本偏好手册，而是因为他同时理解你的脾气、你的项目进度、你的组织环境和他自己的能力边界。

单一维度的记忆系统，无论做得多精细，在根本上就是残缺的。

#Agent Memory#AI工程