黄仁勋 6/27 抛出 Token 工厂经济学，把 Token 变成 AI 时代的'度'。但同一周高通 39 亿买 Modular、SpaceX 收光互连公司，资本用脚投票绕开英伟达。中美算力底层正在分裂成两条路。

Token 是新石油，但加油站正在从英伟达手里溜走

两年时间，AI 世界最大的消耗品从一千亿变成了一百四十万亿。

不是美元，是 Token。2024 年初，全球大模型日均消耗 1000 亿 Token；到 2026 年 3 月，这个数字涨到了 140 万亿（来源：笔记侠《黄仁勋：Token工厂，全新工厂经济体系已诞生》，2026-06-27）。两年涨 1400 倍。

黄仁勋想把这件事讲成一个新故事。

2026 年 6 月 27 日，《黄仁勋：Token工厂，全新工厂经济体系已诞生》刷屏。他刚在 GTC 2026 抛出"Token 工厂经济学"——把 AI 数据中心重新定义为生产 Token 的标准化工厂，Token 是 AI 时代的"新石油"，是"度""公里""张数"——是产出计量单位，不是生产资料（同上来源）。

24 小时后，6 月 28 日，硅谷科技评论 SVTR 发布《资本不再硬刚英伟达：钱开始流向"解绑"和"光"》（来源：SVTR Signal #022）。同一周，高通花 39 亿美元全股票收购了让 AI 代码"一次写好、跨厂商芯片跑"的软件公司 Modular；马斯克的 SpaceX 收购了做 1.6Tbps 光收发器的 Mesh 光学；联发科领投薄膜铌酸锂光子芯片公司 HyperLight 8000 万美元 C 轮。

三笔交易加起来几十亿美元，没有一笔记在英伟达正面战场的账上。

这是 2026 年 AI 基础设施最有意思的一个对照：叙事端在讲新故事，资金端在用脚投票绕开场。

叙事 vs 资本：24 小时对照

黄仁勋的"度"，到底是什么

黄仁勋这套理论的关键，是把"卖 GPU"重新包装成"卖 Token"。

他用一个比喻把抽象概念翻译成常识：Token 就像电表里的"度"。你不会问电网公司配了多少台发电机，只关心这个月用了多少度电、每度多少钱。Token 一样——它是 AI 时代可计量、可定价、可交易的最小结算单位（同上来源）。

2026 年 3 月 23 日，国家数据局局长刘烈宏在中国发展高层论坛上，把 Token 的中文正式命名为"词元"（同上来源）。一个英文技术词，从此有了官方中文译名和中国监管底座。

从"卖卡"到"卖 Token"，听起来像是同一家公司换了种收钱方式。但实质不一样：卖卡是一次性收入，卖 Token 是持续性流水。一台 H100 卖出去，钱就收完了；但一个 Token 生成出来，每个月、每个用户、每次调用都要结算。

黄仁勋想要的是后者。这套逻辑如果跑通，英伟达就不仅是芯片公司，而是 AI 时代的"电网公司"。理论很性感。

但资本市场在同一周给出的答案，是**"我们不买电网公司，我们去买拆电网的工具"**。

同一周，资本的三个动作

6 月最后一周，SVTR 创投库录得 112 笔全球 AI 一级市场与并购事件。最大三笔基础层下注，没有一笔记在英伟达正面战场（来源：SVTR Signal #022）。

动作一：高通 39 亿美元买 Modular。

Modular 成立于 2022 年，做的不是芯片，是一套"硬件无关"的 AI 推理软件——Mojo 编程语言加 MAX 引擎，让开发者写一次 AI 代码，就能在 CPU、GPU、NPU 不同厂商的芯片上跑，不必为每种芯片重写。Modular 2025 年 9 月 C 轮还只值 16 亿美元，半年后被高通以约 40 亿估值收走（同上来源）。

一家芯片巨头，为什么要花近 40 亿买一家"不做芯片"的软件公司？因为高通在算力密度上正面赢不了英伟达，但它可以买下"让代码不绑定英伟达"的那一层。

动作二：SpaceX 收购 Mesh 光学。

Mesh 团队是三位前 SpaceX 星链光通信工程师，成立仅一年，核心产品 Alpha C1 光收发器传输速率达 1.6Tbps，专为 AI 数据中心高速光互连设计。6 月 26 日，美国 FTC 提前终止反垄断等待期放行（同上来源）。

动作三：联发科领投 HyperLight 8000 万美元 C 轮。

HyperLight 用薄膜铌酸锂（TFLN）做集成光子芯片，富士康、UMC 跟投。指向同样是数据中心高速低功耗光互连（同上来源）。

三笔交易的共同点：卖的都不是"算"，而是"连"。

这是一个比"再造一颗 GPU"更聪明的位置：不和英伟达拼它最强的算力密度，转去做它生态里相对开放、又正在变成瓶颈的互连环节。值得注意，连英伟达自己的战投部门都出现在 Upscale AI 的投资方名单里（做 AI 集群全栈网络，1.9 亿美元 A 轮）——说明"卡间通信是下一道墙"，英伟达自己也不否认。

为什么是侧翼战，不是正面战

英伟达的护城河不是 GPU 本身，是 CUDA。

CUDA 是一套只有英伟达 GPU 才原生支持的并行计算框架。全球几百万开发者用 CUDA 写代码、写模型、写训练脚本，写完就只能跑在英伟达上。这层锁定花了十几年才建起来，比任何一款 GPU 都值钱。

高通想买走的，是"让代码不绑定英伟达"的那一层。SpaceX 和联发科押注的，是"把成千上万张卡高效连起来"的那一层。两条都不碰 CUDA，但两条都让 CUDA 的价值缩水。

可以这样理解：CUDA 是 iPhone 充电口，Modular 是 USB-C 转接头。 转接头破不了 iPhone，但它让你出门不用非带那根线。

更深一层的原因，是负载形态变了。

训练是阶段性的峰值负载——一次性烧几个月，比拼单卡和单集群的算力密度，那是英伟达最强的地方。推理是持续性的规模负载——模型训练完后，每天 24 小时不间断调用，比拼单位成本和把海量卡高效连起来的能力（同上来源）。

当行业重心从"训出更大模型"转向"把模型大规模、低成本跑起来"，买家痛点就从"搞不到卡"换成两件新事：被一家芯片生态绑死后的迁移成本，以及卡越堆越多后的通信拥堵。

黄仁勋讲"卖 Token"的故事，本质是想把自己从"卡供给方"重新定位为"算力结算方"。但故事讲得再漂亮，如果"算"这一端被解绑、"连"这一端被分流，他能结算的 Token 流量就会从英伟达的管道里漏出去。

叙事在讲新故事，资金在拆旧管道。

同一道题，中美走两条路

如果说美国资本的解法是"绕"，中国这一周的解法是"补"——而且主战场不在一级市场，在二级市场。

6 月 26 日一天之内，圣邦股份（国内模拟芯片龙头）与芯碁微装（半导体直写光刻设备龙头）两家已在 A 股上市的硬科技公司，同时在港交所完成 A+H 上市，分别募资约 46 亿、32 亿港元，芯碁微装首日大涨约 104%（同上来源）。上一周，腾讯支持的云端 AI 芯片公司燧原科技（Enflame）刚获批在上海科创板 IPO，成为"中国四大 AI 芯片龙"中最后一家进入公开市场的企业。

美国这边，资本绕着英伟达走：用并购买下解绑层（高通买 Modular），用 VC 押注光互连（SpaceX、联发科），从侧翼改写战场规则，融资靠的是一级市场的巨额私募和战略并购。

中国这边，资本正面把整条链补齐：从光刻设备（芯碁微装）到模拟芯片（圣邦）到推理芯片（燧原），一个环节一个环节做国产替代，融资靠的是科创板和港股 A+H 这类公开市场输血（同上来源）。

一个绕，一个补；一个靠并购与私募，一个靠二级市场。

中美算力基础设施双轨对比

对做跨境配置的投资人，这意味着"投 AI 算力底层"在中美是两套承做逻辑。在美国，你押哪一层能撬动英伟达的锁；在中国，你押哪一家能在公开市场拿到钱、把国产替代的某一环跑通。

马斯克最近把 xAI 解散、并入 SpaceX、更名 SpaceXAI（来源：笔记侠《马斯克：未来3年很难熬，必须做对3件事》，2026-06-26）。同一天，DeepSeek V4 已经跑在华为昇腾国产芯片上，处理速度升 35 倍、能耗降 40%（同上来源）。

中美两边的"基础设施层"，正在以完全不同的方式重组。

黄仁勋赢，但英伟达不一定跟着赢

把这一周拼到一起看，黄仁勋讲的那套"Token 工厂经济学"——把 Token 变成 AI 时代的"度"——可能是对的。日均 140 万亿 Token 的消耗量，两年涨 1400 倍，Token 确实正在成为新的通用计价单位。国家数据局给它官方中文译名"词元"的动作，承认了这件事的严肃性。

但"Token 是新石油"和"英伟达是新石油公司"，是两件事。

新石油的提炼厂可以分散——高通在买"让代码跨厂商跑"的解绑层，SpaceX 在买光互连，联发科在押光子芯片。加油站正在从一家手里，悄悄溜向多家手里。

黄仁勋讲了一个关于未来的漂亮故事。资本在同一周把钱压在了"如何让那个未来不必只有英伟达"上。

卖发电机的故事在退场，卖电网的故事刚开张。 但电网这门生意，最后不一定还是英伟达的。

2026 年 6 月底这 24 小时的温差，可能是接下来三年 AI 基础设施最重要的一个分水岭。