本地芯片生产:中国如何构建自己的人工智能生态系统

多年前,世界一直在努力理解数字产业的真正意义。如今,AI革命中的生产是什么?这不仅仅是硬件制造。这是建立一个创新与自主相结合的完整生态系统。在过去的六年多时间里,中国从希望自主研发解决方案,逐步转变为真正掌握计算能力。这一故事始于危机,最终演变成一场革命。

瓶颈不是硬件:为什么CUDA才是真正的障碍

2018年,中兴遭遇了一次考验。美国工业与安全局的禁令让这家拥有8万员工、年收入数十亿美元的跨国公司在一夜之间陷入瘫痪。没有高通芯片,没有谷歌的Android授权——整个运营陷入停滞。

但从更深层次看,真正的问题不仅仅是硬件。这是一个名为CUDA的生态系统。

CUDA,即Compute Unified Device Architecture,是NVIDIA于2006年推出的并行计算平台。在深度学习革命中,它成为整个AI产业的基础。训练大型AI模型本质上是大规模矩阵运算——GPU在这里具有独特优势。NVIDIA用十年时间,构建了一个完整的生态,从底层硬件到上层软件工具,全部围绕CUDA展开。

如今,谷歌的TensorFlow、Meta的PyTorch等主要AI框架都深度依赖CUDA。每个AI开发者从一开始就开始用CUDA编码。由此形成的飞轮效应难以停止:开发者越多,工具越丰富,生态越庞大,加入者也越多。

到2025年,CUDA生态系统拥有超过450万开发者,涵盖3000多个GPU加速应用。全球90%以上的AI开发者都依赖这个生态。你如何打破这个局面?当然可以——但你必须重新编写十年来积累的经验、工具和代码。谁来承担这个成本?

从推理到训练:本地生产的质变

面对美国持续的监管——2022年有NVIDIA的A100和H100,2023年有A800和H800,2024年又有H20——中国AI企业没有放弃直接竞争,而是选择了另一条路径:算法层面的优化。

从2024年底到2025年,中国AI企业转向一种技术方向:专家混合(MoE)架构。以DeepSeek的V3为例,拥有6710亿参数,但每次推理只用到370亿参数——仅占5.5%。训练成本为557.6万美元,而GPT-4预估训练成本为7800万美元。

这种算法优化在价格上表现得淋漓尽致:DeepSeek API每百万tokens的输入费用为0.028到0.28美元,而GPT-4则为5美元。Claude Opus为15美元。中国的成本比美国低25到75倍。

但真正的突破不仅仅在价格。到2025年,AI应用已从简单对话转向Agent场景,token使用量激增10到100倍。在这种规模下,价格成为决定性因素。

如今,本地生产已从推理迈向训练——实现了质的飞跃。推理仅运行预训练模型,训练则需要更高的计算能力、更大的互连带宽和更完善的软件生态。

生态系统的生产:从江苏兴化到全球部署

在产业变革中,江苏兴化建立了一条服务器生产线——一个以不锈钢和健康食品闻名的小城。从签约到投产仅用了180天。生产线配备了两款本地芯片:龙芯3C6000处理器和泰楚元气T100 AI加速器。

这是一个里程碑:如今的生产不仅关乎产量,更关乎能力。满负荷时,每5分钟出一台服务器,每年产量达10万台。

更重要的是,数千个本地芯片集群开始真正训练大型模型。2026年1月,华为发布了GLM-Image——首个用本地芯片全程训练的SOTA图像生成模型。2月,中国电信在上海临港完成了“星辰”模型的全部训练流程。

背后主要力量是华为的昇腾系列。到2025年底,昇腾生态已有400万开发者,合作伙伴超过3000家。43个主要大模型完成了昇腾的预训练,200多个开源模型被适配。

2026年3月2日,华为推出了新一代SuperPoD基础设施。昇腾910B的FP16算力相当于NVIDIA A100。生态系统在芯片不断优化中逐步完善——不等待完美,升级速度极快。

能源优势与算力:为何中国领先

2026年初,弗吉尼亚停止发放新数据中心许可,随后乔治亚、伊利诺伊、密歇根跟进。美国的电网已接近极限。

2024年,美国数据中心用电达183太瓦时,占总用电的4%。到2030年,预计达426TWh,占比12%。Arm的CEO表示,到2030年,AI数据中心可能消耗美国20-25%的电力。

当美国担心电力问题时,中国拥有巨大优势。中国每年发电总量为10.4万亿度,而美国为4.2万亿度——仅是2.5倍。更重要的是,中国的居民用电只占总用电的15%,而美国为36%。这意味着中国有更多工业用电容量可用于计算。

中国西部工业区的电价约为每千瓦时0.03美元,而美国AI中心则为0.12到0.15美元。中国在能源成本上拥有4到5倍的优势。

Token与市场:新兴的数字商品

如今,随着美国投资能源基础设施,中国出口一种新产品:tokens。tokens是AI模型处理信息的最小单位——已成为一种数字商品,在算力工厂中生成,传送到全球。

DeepSeek用户的分布显示:30.7%来自中国,13.6%来自印度,6.9%来自印度尼西亚,4.3%来自美国,3.2%来自法国。这支持多达37种语言,并在巴西等新兴市场快速增长。

2026年2月,在OpenRouter平台上,中国AI模型的每周使用量在三周内激增127%,首次超越美国。一年前,中国模型的市场份额还不到2%,如今已达6%,增长了421%。

2026年2月27日,三家本地芯片公司公布财报:康宁(Cambrian)营收增长453%,首次实现全年盈利;摩尔线程(Moore Threads)增长243%,但净亏损达10亿美元;牧星(Muxi)增长121%,亏损近80亿美元。

火与水的交融。火是市场需求,黄仁勋公布的95%的空间由本地公司收入填补。市场需要没有NVIDIA的第二选择。这是前所未有的结构性机遇。

历史的启示

八年前,发生了一次深远的变革。1986年,美日半导体协议重塑了行业。日本一度领先——到1988年,日本控制了全球半导体市场的51%,而美国为36%。前十名中有六家来自日本。

但通过战略性贸易措施、监管审查和支持韩国竞争者,美国逐步削减了日本在DRAM市场的份额,从80%降至10%。曾经的巨头逐渐被取代、出售或淡出。

悲剧在于:日本满足于全球分工中的“最佳制造商”角色,却未建立自主的生态系统。当潮水退去,他们只剩制造业。

如今的中国AI产业也面临类似压力,但选择了更艰难的道路:极致的算法优化、本地芯片从推理到训练的自主研发、构建拥有400万昇腾开发者的生态系统,以及全球Token分发。每一步都在打造独立的产业生态。

这片海域,生态建设的成本巨大。每一次亏损,都是为了追随CUDA而付出的真实资金——学习成本、软件补贴、工程部署费用。这是实现自主的必要“税”。

这三份财报比任何行业报告都更真实地反映了竞争的现状。这不是庆祝,而是激烈的争夺——士兵们在血与火中崛起。

但数字的形态已然改变。八年前的问题是“我们能否生存?”如今的问题是“我们要付出什么代价才能生存?”而这个代价,就是不断的进步。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论