Agent正在长出记忆：Cloudflare如何让AI忘掉该忘的、记住该记住的

Site Owner

Published on 2026-05-15

Cloudflare发布的Agent Memory解决了一个根本问题：上下文窗口不是记忆，只是一个漏水的桶。当Agent运行数月时，靠压缩上下文来管理记忆是在主动删除重要信息。Cloudflare的方案是把记忆抽出来，建一套独立的记忆管理系统——Ingest管道提取并验证记忆，Recall用五路检索返回合成答案，Remember和Forget让模型主动管理记忆本身。

Agent正在长出记忆：Cloudflare如何让AI忘掉该忘的、记住该记住的

Cloudflare上周发了三篇关于Agent的基础设施文章，件件都是硬货。

但最让我盯着看了十分钟的，是那个叫Agent Memory的东西。

因为它解决了一个所有AI开发者都踩过、但很少有人真正想明白的问题——

当你让一个Agent跑三个月，它凭什么还记得"这个用户喜欢pnpm而不是npm"？

上下文窗口不是记忆，它是一个漏水的桶

现在的Agent，本质上是一个"带着豪华笔记本的失忆症患者"。

上下文窗口再大，也是有限的。而且有个诡异的现象叫context rot——上下文越满，模型越容易忽略真正重要的东西。

你跟它说"用pnpm"，说了一百遍，它第一百零一次还是给你跑npm。你以为它不听话，其实是它已经分不清第一百零一次说的和前面一百次有什么不一样。

大多数团队怎么解决？定期压缩上下文。把对话历史提炼、截断、塞进更短的摘要。

这听起来合理。

但问题是——压缩的那一刻，你可能正在扔掉真正重要的东西。

一个用户说"API限流上个月从1000提到了10000"，这句话在压缩时很可能被当成"常规操作记录"删掉。然后你的Agent三个月后还在按1000的限流配置做事情。

压缩是记忆的敌人。

Cloudflare的解法：建一套记忆外置的基础设施

Cloudflare上周发布的Agent Memory，做法非常直接——

别把记忆塞在上下文里。给Agent单独建一个记忆管理系统。

核心逻辑分三层：

第一层：Ingest——压缩时不扔，把对话扔进记忆管道

当Agent的harness决定压缩上下文时，它把原始对话发给Agent Memory。

Memory系统做这几件事：

Extractor：把对话切成块，提取"事实"（API限流从1000提到了10000）、"事件"（某天部署失败）、"指令"（用户说用pnpm）
Verifier：逐条验证提取的记忆是不是真的，防止幻觉记忆污染
Classifier：分类——Fact、Event、Instruction、Task
Supersession链：如果同一个事实有新旧两个版本，旧的不会被删，而是打一个"已被取代"的标记，形成一条链

这意味着什么？

你的Agent不再靠"上下文里有没有这句话"来判断真假，而是有一个独立的、经过验证的记忆库。

第二层：Recall——用搜索代替记忆

Agent不需要把所有记忆都塞进prompt。

它只需要在需要的时候，问Agent Memory一个问题：

"这个用户偏用什么包管理器？"

#Agent#Agent Memory#AI工程

Agent正在长出记忆：Cloudflare如何让AI忘掉该忘的、记住该记住的

Agent正在长出记忆：Cloudflare如何让AI忘掉该忘的、记住该记住的

上下文窗口不是记忆，它是一个漏水的桶

Cloudflare的解法：建一套记忆外置的基础设施

第一层：Ingest——压缩时不扔，把对话扔进记忆管道

第二层：Recall——用搜索代替记忆

第三层：Remember和Forget——精确操控记忆

实用场景：不止是"记住用户偏好"

和上下文窗口比，到底省了多少？

为什么这件事重要