代码保质期只剩三个月——"为六个月后的模型构建"到底是什么意思
Site Owner
发布于 2026-04-17
Claude Code 负责人 Boris Cherny 的 CLAUDE.md 只有两行——因为模型能力一直在变,你今天精心设计的指令六个月后大概率是废代码。脚手架能带来短期收益,但保质期只有几个月。
代码保质期只剩三个月——"为六个月后的模型构建"到底是什么意思
Claude Code 的负责人自己只用两行配置。
不是因为他懒,是因为他比谁都清楚一个事实:你今天写进去的每一行精心设计的指令,六个月后大概率都是废代码。
这不是危言耸听。Claude Code 的代码库里,80% 是近几个月重写的。Boris Cherny 说"代码的保质期缩短到了几个月"——这话不是比喻,是工程日志。
如果你正在做 AI 相关的产品,这条消息可能值得你停下来想一想。
第一层:两行配置就够了
Boris Cherny 是 Anthropic 的 Claude Code 负责人,这个项目从零到一的推动者。
他的 CLAUDE.md——也就是 Claude Code 最重要的配置文件——只有两行。
很多用户花大量精力去过度设计这个文件,写了几十上百行规则、约束、偏好。Boris 的建议是:如果文件变得太长,删掉重新开始。只保留让模型回到正轨所需的最少内容。
为什么?因为模型能力一直在变。你会发现随着更新,需要添加的指令越来越少。
这个逻辑放到更大的尺度上:Claude Code 刚起步时,模型其实很差。2025 年 2 月发布时大概只能写 10%-20% 的代码,到 5 月份也只有 30% 左右,Boris 大部分代码还是用 Cursor 手写。直到 11 月,比例才跨过 100%。
但从一开始,整个产品就是按照"模型迟早会变好"的假设来设计的。
第二层:苦涩的教训
Boris 团队极度推崇一篇文章:Rich Sutton 大约十年前写的《The Bitter Lesson》(苦涩的教训)。
核心观点只有一句话:更通用的模型总是会击败特定领域的模型。
翻译成工程语言:你花两周搭的脚手架,能带来 10%-20% 的性能提升。但新模型一出来,这些收益基本被抹平。
你要么不断重建脚手架,要么直接等待下一个模型。
Boris 把这个原则翻译成了一个具体的决策框架。每次团队需要在"花工程时间做脚手架提升一点性能"和"等下个模型自带这个能力"之间做选择时,都会认真权衡。他的经验很明确:脚手架能带来短期收益,但保质期只有几个月。
这个判断对所有在 AI 上层做应用的开发者都适用。
如果你现在构建的东西,只有在模型不进步的情况下才有价值——那它大概率是短命的。
第三层:前六个月可能极差
"为六个月后的模型构建"这句话听起来很优雅,但它有一个不舒服的副作用。
产品刚上线时,体验可能极差。
Boris 对此直言不讳:"这会让人很不舒服,但如果你是为六个月后的模型构建产品,当那个模型问世时,你就能立刻起飞。"
想象一下:你做了一个产品,上线后用户反馈很差,投资人开始质疑,团队士气低落。但你知道——不是产品方向错了,是模型还没跟上。
这需要一种近乎偏执的信念。
但这种不舒服恰恰是护城河。因为你的竞争对手大概率不会这么干。他们会选择为当前的模型优化,做出一个体验不错的产品,然后——六个月后,你的产品因为新模型的加持突然变得好用十倍。
最能忍受产品烂半年的人,赢面最大。
这不是鸡汤。看看 Anthropic 自己的路径:前六个月 PMF 极差,内部发帖只收到两个赞。但日活曲线几乎垂直增长,Dario 甚至问 Boris 是不是强制工程师使用。
第四层:什么时候该建,什么时候该等
"为未来模型构建"不等于"什么都不做"。关键在于判断什么值得建,什么不值得。
一个可操作的框架:
不建—— 只在"当前模型不进步"时有价值的东西。比如为特定模型优化的 prompt 工程、为某个 API 版本写的适配层。
建—— 能随模型变强而更有价值的东西。比如高质量的数据管道、清晰的意图定义、好的用户交互设计。模型越强,这些东西越值钱。
等—— 六个月后模型自己就能做的东西。比如你手写了一堆模板来弥补模型的结构化输出能力——下个模型可能原生支持。
Mars 任鑫在《当产能不再稀缺,什么才稀缺?》里有个更极端的推论:产能爆炸之后,需求才是真正的瓶颈。 你选择的竞争维度,比你在那个维度上多努力,重要 100 倍。
放在这里同样成立。你选择"为当前模型优化"还是"为未来模型构建",这个选择本身,比你优化得多精细重要 100 倍。
第五层:对普通开发者意味着什么
Boris 讲了一个让他印象深刻的案例。
他遇到一个内存泄漏问题,按照多年养成的习惯去提取堆快照、打开调试器、翻阅跟踪记录——标准的老工程师操作。结果团队里一个比较新的工程师直接问 Claude Code:"好像有泄漏,你能找出来吗?"
Claude Code 做了跟 Boris 完全一样的事:提取堆快照、给自己写分析工具,然后比 Boris 更快地定位了问题并提交了 PR。
Boris 的反思很扎心:资深工程师的经验有时反而会成为障碍。他说自己"有时候思维还停留在六个月前的模型上"。
这不是个例。Boris 在招聘时最喜欢问的面试题是"举一个你犯错的例子"。在模型快速迭代的时代,能承认错误、从中学习的能力,比"强烈的技术观点"更有价值。
经验曾经是工程师最值钱的资产。现在"保持初学者心态"可能比经验本身更值钱。
不是因为经验不重要了,而是因为经验的半衰期缩短了。你积累的"这个模型不行"、"这个 API 有坑"的知识,下个版本可能就失效了。真正能穿越模型迭代周期的能力,是判断力——知道该让 AI 做什么、不该做什么。
Boris 观察到最有效的工程师呈现出两极分化:一端是极端专家,比某个领域的所有人都懂得多;另一端是超级通才,跨越产品、设计、基础设施等多个领域。对大多数人来说,后一条路的回报可能更大。
当编程不再是稀缺技能,真正稀缺的是判断力、品味和把不同领域串起来的能力。
这不是未来。这是现在。
(全文约 1900 字)