Token 是新石油,但加油站正在从英伟达手里溜走
Site Owner
发布于 2026-07-01
黄仁勋 6/27 抛出 Token 工厂经济学,把 Token 变成 AI 时代的'度'。但同一周高通 39 亿买 Modular、SpaceX 收光互连公司,资本用脚投票绕开英伟达。中美算力底层正在分裂成两条路。
Token 是新石油,但加油站正在从英伟达手里溜走
两年时间,AI 世界最大的消耗品从一千亿变成了一百四十万亿。
不是美元,是 Token。2024 年初,全球大模型日均消耗 1000 亿 Token;到 2026 年 3 月,这个数字涨到了 140 万亿(来源:笔记侠《黄仁勋:Token工厂,全新工厂经济体系已诞生》,2026-06-27)。两年涨 1400 倍。
黄仁勋想把这件事讲成一个新故事。
2026 年 6 月 27 日,《黄仁勋:Token工厂,全新工厂经济体系已诞生》刷屏。他刚在 GTC 2026 抛出"Token 工厂经济学"——把 AI 数据中心重新定义为生产 Token 的标准化工厂,Token 是 AI 时代的"新石油",是"度""公里""张数"——是产出计量单位,不是生产资料(同上来源)。
24 小时后,6 月 28 日,硅谷科技评论 SVTR 发布《资本不再硬刚英伟达:钱开始流向"解绑"和"光"》(来源:SVTR Signal #022)。同一周,高通花 39 亿美元全股票收购了让 AI 代码"一次写好、跨厂商芯片跑"的软件公司 Modular;马斯克的 SpaceX 收购了做 1.6Tbps 光收发器的 Mesh 光学;联发科领投薄膜铌酸锂光子芯片公司 HyperLight 8000 万美元 C 轮。
三笔交易加起来几十亿美元,没有一笔记在英伟达正面战场的账上。
这是 2026 年 AI 基础设施最有意思的一个对照:叙事端在讲新故事,资金端在用脚投票绕开场。

黄仁勋的"度",到底是什么
黄仁勋这套理论的关键,是把"卖 GPU"重新包装成"卖 Token"。
他用一个比喻把抽象概念翻译成常识:Token 就像电表里的"度"。你不会问电网公司配了多少台发电机,只关心这个月用了多少度电、每度多少钱。Token 一样——它是 AI 时代可计量、可定价、可交易的最小结算单位(同上来源)。
2026 年 3 月 23 日,国家数据局局长刘烈宏在中国发展高层论坛上,把 Token 的中文正式命名为"词元"(同上来源)。一个英文技术词,从此有了官方中文译名和中国监管底座。
从"卖卡"到"卖 Token",听起来像是同一家公司换了种收钱方式。但实质不一样:卖卡是一次性收入,卖 Token 是持续性流水。一台 H100 卖出去,钱就收完了;但一个 Token 生成出来,每个月、每个用户、每次调用都要结算。
黄仁勋想要的是后者。这套逻辑如果跑通,英伟达就不仅是芯片公司,而是 AI 时代的"电网公司"。理论很性感。
但资本市场在同一周给出的答案,是**"我们不买电网公司,我们去买拆电网的工具"**。
同一周,资本的三个动作
6 月最后一周,SVTR 创投库录得 112 笔全球 AI 一级市场与并购事件。最大三笔基础层下注,没有一笔记在英伟达正面战场(来源:SVTR Signal #022)。
动作一:高通 39 亿美元买 Modular。
Modular 成立于 2022 年,做的不是芯片,是一套"硬件无关"的 AI 推理软件——Mojo 编程语言加 MAX 引擎,让开发者写一次 AI 代码,就能在 CPU、GPU、NPU 不同厂商的芯片上跑,不必为每种芯片重写。Modular 2025 年 9 月 C 轮还只值 16 亿美元,半年后被高通以约 40 亿估值收走(同上来源)。
一家芯片巨头,为什么要花近 40 亿买一家"不做芯片"的软件公司?因为高通在算力密度上正面赢不了英伟达,但它可以买下"让代码不绑定英伟达"的那一层。
动作二:SpaceX 收购 Mesh 光学。
Mesh 团队是三位前 SpaceX 星链光通信工程师,成立仅一年,核心产品 Alpha C1 光收发器传输速率达 1.6Tbps,专为 AI 数据中心高速光互连设计。6 月 26 日,美国 FTC 提前终止反垄断等待期放行(同上来源)。
动作三:联发科领投 HyperLight 8000 万美元 C 轮。
HyperLight 用薄膜铌酸锂(TFLN)做集成光子芯片,富士康、UMC 跟投。指向同样是数据中心高速低功耗光互连(同上来源)。
三笔交易的共同点:卖的都不是"算",而是"连"。
这是一个比"再造一颗 GPU"更聪明的位置:不和英伟达拼它最强的算力密度,转去做它生态里相对开放、又正在变成瓶颈的互连环节。值得注意,连英伟达自己的战投部门都出现在 Upscale AI 的投资方名单里(做 AI 集群全栈网络,1.9 亿美元 A 轮)——说明"卡间通信是下一道墙",英伟达自己也不否认。
为什么是侧翼战,不是正面战
英伟达的护城河不是 GPU 本身,是 CUDA。
CUDA 是一套只有英伟达 GPU 才原生支持的并行计算框架。全球几百万开发者用 CUDA 写代码、写模型、写训练脚本,写完就只能跑在英伟达上。这层锁定花了十几年才建起来,比任何一款 GPU 都值钱。
高通想买走的,是"让代码不绑定英伟达"的那一层。SpaceX 和联发科押注的,是"把成千上万张卡高效连起来"的那一层。两条都不碰 CUDA,但两条都让 CUDA 的价值缩水。
可以这样理解:CUDA 是 iPhone 充电口,Modular 是 USB-C 转接头。 转接头破不了 iPhone,但它让你出门不用非带那根线。
更深一层的原因,是负载形态变了。
训练是阶段性的峰值负载——一次性烧几个月,比拼单卡和单集群的算力密度,那是英伟达最强的地方。推理是持续性的规模负载——模型训练完后,每天 24 小时不间断调用,比拼单位成本和把海量卡高效连起来的能力(同上来源)。
当行业重心从"训出更大模型"转向"把模型大规模、低成本跑起来",买家痛点就从"搞不到卡"换成两件新事:被一家芯片生态绑死后的迁移成本,以及卡越堆越多后的通信拥堵。
黄仁勋讲"卖 Token"的故事,本质是想把自己从"卡供给方"重新定位为"算力结算方"。但故事讲得再漂亮,如果"算"这一端被解绑、"连"这一端被分流,他能结算的 Token 流量就会从英伟达的管道里漏出去。
叙事在讲新故事,资金在拆旧管道。
同一道题,中美走两条路
如果说美国资本的解法是"绕",中国这一周的解法是"补"——而且主战场不在一级市场,在二级市场。
6 月 26 日一天之内,圣邦股份(国内模拟芯片龙头)与芯碁微装(半导体直写光刻设备龙头)两家已在 A 股上市的硬科技公司,同时在港交所完成 A+H 上市,分别募资约 46 亿、32 亿港元,芯碁微装首日大涨约 104%(同上来源)。上一周,腾讯支持的云端 AI 芯片公司燧原科技(Enflame)刚获批在上海科创板 IPO,成为"中国四大 AI 芯片龙"中最后一家进入公开市场的企业。
美国这边,资本绕着英伟达走:用并购买下解绑层(高通买 Modular),用 VC 押注光互连(SpaceX、联发科),从侧翼改写战场规则,融资靠的是一级市场的巨额私募和战略并购。
中国这边,资本正面把整条链补齐:从光刻设备(芯碁微装)到模拟芯片(圣邦)到推理芯片(燧原),一个环节一个环节做国产替代,融资靠的是科创板和港股 A+H 这类公开市场输血(同上来源)。
一个绕,一个补;一个靠并购与私募,一个靠二级市场。

对做跨境配置的投资人,这意味着"投 AI 算力底层"在中美是两套承做逻辑。在美国,你押哪一层能撬动英伟达的锁;在中国,你押哪一家能在公开市场拿到钱、把国产替代的某一环跑通。
马斯克最近把 xAI 解散、并入 SpaceX、更名 SpaceXAI(来源:笔记侠《马斯克:未来3年很难熬,必须做对3件事》,2026-06-26)。同一天,DeepSeek V4 已经跑在华为昇腾国产芯片上,处理速度升 35 倍、能耗降 40%(同上来源)。
中美两边的"基础设施层",正在以完全不同的方式重组。
黄仁勋赢,但英伟达不一定跟着赢
把这一周拼到一起看,黄仁勋讲的那套"Token 工厂经济学"——把 Token 变成 AI 时代的"度"——可能是对的。日均 140 万亿 Token 的消耗量,两年涨 1400 倍,Token 确实正在成为新的通用计价单位。国家数据局给它官方中文译名"词元"的动作,承认了这件事的严肃性。
但"Token 是新石油"和"英伟达是新石油公司",是两件事。
新石油的提炼厂可以分散——高通在买"让代码跨厂商跑"的解绑层,SpaceX 在买光互连,联发科在押光子芯片。加油站正在从一家手里,悄悄溜向多家手里。
黄仁勋讲了一个关于未来的漂亮故事。资本在同一周把钱压在了"如何让那个未来不必只有英伟达"上。
卖发电机的故事在退场,卖电网的故事刚开张。 但电网这门生意,最后不一定还是英伟达的。
2026 年 6 月底这 24 小时的温差,可能是接下来三年 AI 基础设施最重要的一个分水岭。