算力战争下半场:推理即一切
Site Owner
Published on 2026-05-24
当Scaling Law从训练阶段延伸到推理阶段,AI行业的游戏规则正在被彻底改写。o1和DeepSeek-R1带来的不只是新技术,而是一整套新的竞争逻辑——从资源游戏到效率游戏。这篇文章告诉你:为什么现在才发生、谁在受益、为什么Agent的算力账单会爆炸,以及技术决策者必须问自己的三个问题。

算力战争下半场:推理即一切
2017年,OpenAI创始人Sam Altman说过一句话:"看起来我们要 Scale up。"那年Transformer刚出来,GPT-1还是个玩具。但历史回头看,总是很清晰——那个判断改变了整个行业。
过去八年,游戏规则只有一条:把模型做大,把数据堆多,让训练算力暴力出奇迹。Scaling Law就是那根指挥棒。所有人的眼睛都盯着NVIDIA的市值,所有人的军备竞赛都在pre-training阶段。
2025年,规则变了。
新大陆不是Scaling Law的延续,是它的反面
2025年的AI圈,o1和DeepSeek-R1横空出世,带来了一个被行业迅速接受的新概念:推理时间缩放(Inference-Time Scaling)。
简单说:不再只是训练时拼命算,推理时也可以拼命算。模型回答问题之前,会"停下来想一想"——这个思考过程本身就是一种算力消耗,而花更多算力让模型想得更深,效果确实更好。
这听起来像是Scaling Law的自然延伸。但稍微深想一层,你会发现它本质上是两代人完全不同的博弈策略:
| Pre-training Scaling | Inference-Time Scaling | |
|---|---|---|
| 算力砸在 | 训练阶段 | 推理阶段 |
| 核心资源 | GPU集群、数据 | 推理时间、内存带宽 |
| Scaling的对象 | 参数、数据、浮点运算 | Token数量、思考步数 |
| 瓶颈 | 训不起、太贵 | 等不起、太慢 |
| 代表玩家 | OpenAI GPT-5、Meta | OpenAI o1、DeepSeek-R1 |
这不只是技术路线的分歧,这是两套完全不同的商业逻辑。
Pre-training Scaling的受益者,是那些能买到最多H100的人——大厂、云计算巨头、国家队。推理时间Scaling的受益者,是那些能把推理效率做高的人——优化推理框架的、搞量化压缩的、做专用推理芯片的。
前者是资源游戏,后者是效率游戏。 当行业从资源游戏转向效率游戏,游戏规则和玩家版图都会重构。
为什么现在才发生?
推理时间Scaling这个事情,理论上早就有人想过。为什么2025年才成为主流?
原因一:LLM的基础能力终于到了"值得思考"的门槛。
以前的小模型,你让它思考十分钟,它也写不出什么好代码。模型太弱,思考是浪费时间。但GPT-4级别以上的模型,已经有能力从更深的推理中持续获益——给它更多时间,它真的能想到更巧妙的解法。这条曲线在2024年出现了拐点。
原因二:Pre-training Scaling的边际收益在递减。
GPT-3到GPT-4的跨越是质的飞跃,但GPT-4到GPT-4.5,业界心照不宣的共识是:进步没有那么大。而R1和o1通过在推理阶段投入更多算力,在很多任务上直接追平甚至超越了用更多数据训练的下一代模型。换句话说:推理阶段多思考,比训练阶段多堆数据,更划算。
原因三:行业需要新的叙事来维持估值。
这个原因说出来不好听,但很现实。2023年大家都在喊"AGI就在眼前",2024年开始有人悄悄修正措辞"通用人工智能还需要更多突破",2025年的融资PPT再不换个新说法,投资人就不买单了。推理时间Scaling恰好提供了一个听起来很深刻、又很容易向非技术人员解释的新叙事。