AI 写代码这件事,已经没人管了
Site Owner
Published on 2026-04-15
AI写代码的速度越来越快,但代码审核和质量把控的体系却没有跟上。从开源社区的AI slop泛滥,到企业内部的AI代码审核缺失,AI生成代码正在进入一个无人负责的灰色地带。文章分析了AI代码治理的现状和挑战,探讨了代码责任归属的核心问题。
AI 写代码这件事,已经没人管了
作者:达达 | 墨千Byte&Beyond 发布时间:2026-04-11
OpenAI 近期在 Latent Space 播客上亮出了一组数据:
他们的内部团队 Frontier,维护着一个 100 万行代码的仓库。零行人类手写。五个月累积了数千个 PR,零行人类审查。
团队负责人 Ryan Lopopolo 在社交媒体上有一系列激进的言论,其中最出圈的一句是:
如果你每天不花超过 10 亿 token,那你"近乎失职"(borderline negligent)。
这话听着像在催你冲业绩。但背后的数据确实扎眼——Frontier 团队用纯 Agent 驱动的方式,五个月就交付了一个可上线的内测产品。
以下内容参考自 Latent Space 对 Ryan Lopopolo 的深度访谈、Meta Engineering Blog、Vercel Blog 及 Stack Overflow Blog。
不是"辅助",是"接管"
先别急着反驳"AI 写的代码哪能上生产"。来看看谁已经在这么干了:
Meta 的 KernelEvolve 系统,让 AI Agent 自动优化底层硬件代码。它把内核优化问题建模成一个搜索问题——Agent 会在数百种候选实现中搜索最优解,自动编译、评测、调优。结果:广告推荐模型的推理吞吐量提升 60%,训练吞吐量提升 25%。人类专家做同样的事需要几周,Agent 几小时搞定。
OpenAI 的 Symphony,是一个开源的 Elixir 参考实现,本质上是一套 spec + 编排框架。它的核心理念是:你不需要共享源代码,只要有一份高保真的 spec,Agent 就能从零复现整个系统。Frontier 团队基于这套框架,协调大量 Codex Agent 在共享代码库上并行工作——每个 Agent 有独立的 git worktree,可以独立写代码、跑测试、提交 PR。
Vercel 近期展示了 FLORA 这个案例——一个创意视觉工作流平台,其中的 AI Agent FAUNA 负责时尚拍摄方向的视觉创意迭代,包括 moodboard 生成和风格探索。它解决的是创意探索的效率问题,让设计师能在更短的时间内评估更多视觉方向。
注意一个共同点:这些都不是"AI 帮我补全代码"的 Copilot 模式。Agent 在跑完整流程,人类只做关键决策和系统设计。
真正的瓶颈变了
OpenAI 的团队发现了一件很有意思的事:
早期用 Codex 的时候,慢得要命。
不是模型慢,是整个流程慢。Agent 写完代码要编译、要测试、要修 bug、要跑回归……一个内循环走下来可能要十分钟。Agent 就在那等。
所以团队做了什么?把编译时间压到一分钟以内。
听起来很基础?但这正是关键——当你让 AI Agent 干活的时候,瓶颈不是 AI 的能力,而是 基础设施跟不上 AI 的速度。
Ryan 在采访中说了一句话:
真正的瓶颈已经不是 token,而是人类的注意力。
一个 AI Agent 一天能跑几百个实验,人类能 review 几个?Frontier 团队的解法是:不让人类逐行 review 了。改成让 Agent 自己 review 自己的代码,人类只看 Agent 的 review 结果和最终的系统级指标。
代码正在变成"快消品"
在 Latent Space 的同一期采访中,Ryan 谈到了一个概念叫 "ghost library"(幽灵代码库):代码可以随时从 spec 重新生成、随时丢弃,真正值钱的不是代码本身,而是那份高保真的 spec。
这和五年前的软件工程理解完全不同。五年前,一段好的代码是团队资产,要小心维护、认真 review。现在?
当 Agent 可以随时重写、自动修 bug、自动解决 merge conflict 的时候,代码本身的稀缺性在急剧下降。
但这不意味着代码不重要。意味着稀缺的东西转移了——从"写代码的能力"转向了"定义问题和设计系统的能力"。
但是……
说几个现实问题:
这套玩法需要钱。 每天几千美元的 token 费,加上基础设施成本,不是所有团队都能承受。OpenAI 可以这么玩,因为他们自己就是模型提供商。
需要极强的工程基础。 OpenAI 能让 Agent 自己 review 代码,前提是他们有完善的 CI/CD、高测试覆盖率和成熟的监控体系。你让 Agent 在一个没有测试的项目上干活,它只会越改越烂。
人类的价值没有消失,只是转移了。 Ryan 自己说,他现在的工作更像产品经理——设计 Agent 的工作流、定义质量标准、处理安全边界。但他同时也强调,这种"指挥 AI"和传统 PM 有本质区别:你必须深度理解技术实现的边界,才能给 Agent 设定正确的约束。
所以,普通人该怎么办?
别跟 AI 比写代码了。这仗已经打完了。
但你可以比的是:
- 定义问题的能力 —— Agent 能解决你给的任何问题,但"该解决什么问题"还是人决定的
- 设计系统的能力 —— 怎么让多个 Agent 协作?怎么设质量门控?怎么处理边界情况?
- 判断取舍的能力 —— 三个方案摆在你面前,选哪个?这需要行业经验和对业务的深度理解
Stack Overflow 近期有一篇文章标题很到位:
AI is becoming a second brain at the expense of your first one
(AI 正在成为你的第二大脑,代价是你的第一大脑)
这话不无道理。当你习惯性地让 AI 帮你想方案的时候,你自己的思考能力确实在退化。
所以我的建议是:用 AI 干活,但自己想问题。
让 AI 写代码、写文档、跑测试、做 review。但你得知道为什么这么做,知道什么是对的什么是错的,知道什么时候该说不。
这大概就是 2026 年软件工程师的新定位——不是写代码的人,是 设计系统让 AI 写代码的人。
要求更高了,但天花板也更高了。
参考来源:
- Extreme Harness Engineering for Token Billionaires - Latent Space(对 Ryan Lopopolo 的深度采访)
- KernelEvolve: How Meta's Ranking Engineer Agent Optimizes AI Infrastructure
- How FLORA shipped a creative agent on Vercel's AI stack
- AI is becoming a second brain at the expense of your first one - Stack Overflow Blog
- OpenAI Frontier & Symphony