文 | 佘宗明

“Who is winning in AI—China or America?”去年9月,《经济学人》抛出了这么个AI圈和键政圈共同的必谈话题。

搁前两年,答案似乎不言自明,当时的画风就摆在那——

2023年9月,黄奇帆发声:中美AI大模型差距至少在2年以上,差距还在快速拉大。

2024年3月,蔡崇信跟挪威主权财富基金掌舵人对话时,被问到中国在AI发展上跟美国“(差了)一年、三年还是五年?”后,回答“可能比美国顶级LLM(大语言模型)落后两年。”

2024年7月,梁文峰受访时表示:表面上中国 AI 与美国可能仅有一两年的技术代差,但真实的差距是原创和模仿之差。

但自去年以来,画风似乎陡转。

去年11月,包括FT在内的多家主流媒体都报道了黄仁勋在某场闭门会议中的说法:中国会赢得AI竞赛。理由是,更低能源成本、更宽松监管环境和百万级AI工程师规模。

虽然黄仁勋事后对此否认,称没有说过中国会赢得中美AI竞赛,但他仍强调了目前世界上最流行的开源AI模型都来自中国,美国必须“加快步伐”。

今年1月,马斯克在访谈中说,“人们严重低估了增加电力供应的难度,未来两年,谁能解决电力和冷却问题,谁就能赢得AI战争。”并强调中国在电力生产方面的巨大优势,预测 “2026年中国发电量将是美国的3倍”。

没过多久,他又表示,“AI部署的根本限制因素是电力供应,很明显,我们很快——甚至可能就在今年晚些时候——就会制造出更多芯片,却因电力不足无法启用”“除中国外,全球电力输出已基本停滞,而芯片产能却在指数级增长”,指出中国是全球AI电力瓶颈的“例外”。

现在看,Token为王时代的到来,俨然佐证了黄仁勋和马斯克对中国赢面的判断。

全球最大的AI模型API聚合平台OpenRouter数据显示,今年2月,在全球Token调用量排名前五的模型中,中国独占四席,MiniMax
M2.5、Kimi K2.5、智谱 GLM 5、DeepSeek V3.2 包揽前列。中国AI模型Token调用量首次超过美国。

问题来了:是时候喊出那四个字——“湖人总冠……”,说错了,是“中或最赢”吗?

我的看法是:现在说“赢”为时尚早,但中国确实手握了多项优势,善用这些优势,才能为把握未来AI竞争中的主导权攒下更多筹码。

01

种种迹象表明,2026年是AI发展大年,年初的红包大战只是前戏,现在的Token生产、分发、消耗、变现全链路争夺战才是正戏。

这些天,有几个标志性事件就摆在那:

1,中国掀起“龙虾热”,腾讯、阿里、字节、百度等纷纷推出一键安装的“龙虾套餐”。

2,国内“龙虾三兄弟”迅策科技、Minimax、智谱股价都已翻番,市值不断创下新高。

3,3月16日,阿里成立 Alibaba Token Hub(ATH)事业群,由CEO吴泳铭亲自挂帅。

4,3月18日,在2025年度业绩沟通会上。马化腾首谈“龙虾”:龙虾类应用打造了新的去中心化入口,给微信AI开发带来了启发。

5,3月18日,阿里云、百度智能云同日因Token调用量暴涨上调AI算力、存储产品价格。

这些情形,相当于给黄仁勋在GTC2026演讲中的重磅论断做了注解:

AI已从训练时代全面进入推理+智能体+物理 AI 的工业化时代,Token 成为AI执行时代的数字大宗商品与硬通货。

未来数据中心不再是文件仓库,而是不间断生产Token的巨型工厂,Token成为AI生成智能的基本可交易单位。

这叠合成的一句话便是:Token为王时代,已经来了。

AI时代的竞争,早已从单一的模型迭代、芯片比拼,升级为以Token为核心计量单位的算力价值争夺战。

而Token变成AI时代产业竞争的关键筹码、全球算力秩序重构的核心锚点,对中国AI资产提升整体上是利好的。

拼模型,在OpenAI的GPT、Anthropic的Claude、谷歌的Gemini面前,国产大模型依旧是弟弟。

虽然斯坦福大学人工智能研究所2025发布的报告显示,中美顶级AI模型性能差距已缩至0.3%(2023年为20%),但若摒弃“只要定语加得多,自己也能是第一”的口嗨式玩法,就不得不承认,差距依旧不小。

拼芯片,中国“AI芯片三巨头”寒武纪、摩尔线程、沐曦能争的,也就是个“中国英伟达”的Title。

二者的差距,就跟我和吴彦祖的颜值PK是一样一样的。

但要拼Token……估计不少中国AI企业的os是:聊到这个,我可就不困了啊。

这波“龙虾热”,带动MiniMax和智谱年内市值翻番、Kimi母公司月之暗面估值3个月内翻4倍,给了阿里云把价格打上去的底气,就说明了很多事情。

要不是恒科“没有纳斯达克的命,得了纳斯达克的病”,中国AI资产借着这股龙虾热潮实现全面爆发,未必就是奢望。

说到这,还得感谢龙虾(OpenClaw)之父彼得·斯坦伯格。OpenClaw爆火,AI Agent爆发,打通了AI应用落地的“最后一公里”,让Token消耗量实现了几何级增加,直接带来了“印钞机效应”。

“龙虾三兄弟”的庆功宴上,虽说鱼头对准彼得·斯坦伯格有些政治不正确,但人家不来,谁都不能动筷子,总该是基本礼仪吧。

02

Token为王时代到来,很多玩法就变了。

阿里为什么要成立ATH,将模型研发、算力调度、MaaS 平台、场景应用整合在一块?

可以这么理解:Token就是包饺子用的馅料,ATH是在将做AI的业务线并成“Token大本营”——实验室负责调馅(造Token),阿里云负责送饺子皮(运Token),千问和悟空就是煮饺子卖钱的(用Token),进而打造“创造Token-输送Token
-应用Token” 的全产业链体系,从模型厂商转型为Token供应商与基础设施运营商。

阿里要这么做的原因并不复杂:Token双重属性的任督二脉已经被“小龙虾”打通了,其中一面是能源属性——Token是AI世界的“石油”,谁能以最低成本生产高质量Token,谁就掌握产业定价权;另一面是货币属性——Token是生态内的通用“货币”,连接模型厂商、云服务商、开发者与终端用户,支撑订阅付费、按量计费、生态分成等多元商业模式。

随之而来的,是数字经济核心发展逻辑的转变。

在前AI时代,流量是核心:用户增长、日活月活、使用时长、广告库存是胜负手,产品服务的边际成本趋近于零,规模越大成本越低。所以那时争的是垄断式入口,是国民总时间,是流量最大化变现。

在AI时代,核心是Token:日总Token消耗、单用户Token消费、付费转化率、任务闭环率成为核心指标,行业评价体系从DAU、MAU转向TPD(Token Per Day),从比拼模型参数转向单Token成本、每瓦Token产出、智能密度。

所以BAT近期的战略转向很明显:手握AI
To
C领跑者豆包的字节,有意从内容分发帝国转向全场景Token消费枢纽;用千问实现了“一句话购物、打车、点外卖、订酒店”全链路闭环的阿里,有意从电商生态巨头转向Token工业化生产与交易闭环运营商;近来推出龙虾全家桶的腾讯,有意从社交连接王者转向社交链Token裂变与智能体控制平台。

方式就是拥抱龙虾,玩转龙虾,超越龙虾。

此处应该配上台词:龙虾热的红利,MiniMax、Kimi和智谱吃得,我大厂吃不得?

谷歌、微软、Meta们想说“我也想吃”,可OpenRouter平台的Token调用量却捂住了他们的嘴巴:不,你们吃不上。

就GPT、Claude、Gemini顶尖大模型那感人的API调用价格,就足以劝退很多人。

诸多因素决定了,小龙虾注定是“墙外开花墙内香”。

最起码,国外顶尖大模型的云端垄断、高价计费模式,就跟本地智能体的发展趋势不太“适配”。

03

在Token为王时代,谁能以更低的成本生产Token,谁能构建更高效的Token流通生态,谁就能在全球AI竞争中占据更多主动。

就目前看,中国已成为全球Token生产的“超级工厂”。而中国的Token产能优势,也正部分对冲中美AI竞赛中芯片和模型维度的竞争劣势。

黄仁勋把AI产业链划分为“五层蛋糕”模型,自下而上依次为能源、芯片、基础设施(数据中心、算力网络)、模型和应用。这里的“能源”,首要指向是电力。正如黄仁勋所说,“实时生成的智能需要实时产生的电力支持。每一个生成的
token,都是电子流动、热量管理以及能量转化为计算的结果。”

马斯克再三强调“能源等于智能”“瓦特将成为新货币”,意思也差堪仿佛:AI的尽头是算力,算力的尽头是电力。

说白了,算力的本质是能源的转化,电力是支撑AI算力运转的核心动力。对于大规模算力集群而言,电力成本在运营成本中占比极高,尤其是在推理端。可以说,电价的高低,直接决定了Token生产的成本底线。

而中国恰恰有着独一无二的电力供给条件:它“既有又有”,既有廉价性,又有稳定性。

就廉价性来说,西部新能源富集区的绿电成本低至0.2至0.3元人民币/度,仅为欧美同期工业电价的1/3甚至1/5。MiniMax
M2.5在OpenRoute上的百万Token输入价格仅为0.3美元,是Claude
Opus等海外同级别高端模型价格的1/20;DeepSeek
V3.2则通过技术优化,将每百万Token价格压至GPT-5.4的近1%……就离不开廉价电力的“助攻”。

就稳定性看,咱们可以不懂什么叫特高压输电网络,不知何为“源网荷储”一体化物理架构,不解电网冗余度达80%-100%意味着什么,但“海外头号中国电力宣传员”马斯克说中国是全球AI电力瓶颈的“例外”,不全是身为“中国夸夸群群主”的自觉。

如果说是国内的“西电东送”支撑了中国如今在全球的“西数东算”Token出口局面,那欧美国家在起步上就输了——“西电东送”?那是不可能的,大America自有国情在此。

需要看到的是,中国能成为Token生产的“超级工厂”,除了“成本优势”外,还有“生态优势”上。廉价电力对应的是成本优势,全链算力底座对应的则是生态优势。

在硬件-软件-数据-应用的完整产业链闭环构建上,中国将原来在工业领域的“唯一具备全门类能力”的剧本复制了过来,成为全球唯一拥有完整算力产业链的国家。

硬件上,高端GPU领域跟英伟达差距得正视,但从寒武纪、摩尔线程们的市梦率看,资本市场对国产替代还是寄予了厚望的,而国产芯片确实也在进步——这点还得感谢特朗普的“曲线助攻”。

软件上,MoE架构、异构算力调度等算法优化、Token分发上的优化措施,也充分发挥了咱们在“拼得多,省得多”的惯有优势。

至于数据跟应用,也毋庸多言了。这波“龙虾热”背后Token从生产向流通、消费全链条延伸的态势,就离不开全场景应用的支撑。

正是凭借成本优势+生态优势,中国才能成为全球 Token市场呈现出 “一超多元” 格局中的那个“一超”。

而今,美国依旧掌握高端芯片、底层算法的部分核心技术,但在Token规模化生产、成本控制上没有优势;欧洲、日本等经济体受制于算力基建不足、能源成本高企,难以形成规模化竞争力。

相形之下,中国则成了全球最大的Token生产国与出口国——因为性价比够高,Token隐约有成为继“新三样”后中国“数字出口新名片”的势头。

04

说到底,在Token为王时代,中国的Token产能优势就成为AI产业发展优势的强力支点。

Token的普及,会彻底改变算力价值的计量与分配逻辑。

在此之前,算力的价值难以标准化、可交易化,只能按硬件成本计价,这时候,算力定价权掌握在英伟达、AWS、Azure们手上。

到了Agent时代后,Token则能将抽象的算力转化为可精确计费、可跨境流通的“数字商品”,变成了按场景价值计费,数据中心从服务器集群变成“Token工厂”,算力网络变成“Token管网”,用户交互变成“Token消费”,那也就成了中国AI公司的舒适区。

比模型,暂时还比不过GPT、Claude、Gemini;比芯片,眼下也比不过英伟达、AMD等。但要比Token产能……这里请把马斯克语录循环播放。

可以预见,随着Agent代表的应用落地阶段到来,Token消耗量必然会延续指数级增长趋势,Token经济有望迎来规模化爆发,成为中国AI抢占全球智能生态主导权、构筑长期核心竞争力的重要引擎。

“龙虾热”在点Token成金,中国在AI落地应用上的优势正在释放。

可若是秉持“赢学思维”看待这番情形,认为“中或最赢”中的最赢指的是全面超越、跨代领先,又未免有些嗨过头了——着眼现实看,这类嗨过头的看法,正是那些“厉害体”拥趸的常见论调。

Token产能优势确实筑起了中国在算力PK中的核心壁垒,但这仍是局部优势,离转化为整体代际优势仍有不短的路要走。

尽管Token产能优势能让很多人少些“中国AI被美国AI拉大差距”的焦虑,却也不足以支撑“中国AI已全面赶超美国AI”的自大。

至少在GPT、Claude、Gemini依旧作为国产大模型发布会上的对标对象存在时,在寒武纪仍被称作“中国英伟达”而非英伟达被称为“中国小寒武纪”时,在“Our
Chinese are better than their
Chinese”得到扭转前,我们仍需正视底层框架、核心算法专利上的差距和高端GPU芯片上的短板。

不难想见,在很长时间内,“美国强基础创新,中国强工程应用”的差异化格局大概率仍会存在,二者双峰并峙的局面仍会延续,输赢在竞合格局中难以立马见分晓。

争个输赢固然重要,但更重要的是充分发挥比较优势。

而发挥比较优势,要的是多些脚踏实地,能在自卑和自大中选择自省与自信,在看到自我优势和看到别人优势中选择“Both”,而非“赢学思维”下的无脑亢奋。