字节5万块推理芯片的算力账,国产替代新拐点来了

24小时AI快讯5小时前发布 changgong
125 00

每日AI新闻

5万块推理芯片、6亿元硬件采购额、占据供应商预期产能的一半,这不是一家科技公司的常规采购,而是一次对国产AI芯片的信任投票。字节跳动正在用真金白银验证一个命题:国产推理芯片到底能不能撑起亿级用户的AI产品。

一、字节的5万块推理芯片到底能干什么

先算一笔最简单的账。

天数智芯智铠推理芯片单块均价1.2万元,5万块就是6亿元的硬件采购额。但如果只算金额就浪费了这个数字,5万块推理芯片的真正含义,是字节跳动在给豆包的推理算力建一座“高速公路”。

按照智铠芯片的典型推理性能(INT8精度下约200TOPS),5万块芯片提供的总算力约为1000万TOPS(50000 × 200)。这是什么概念?一次豆包的文本推理请求(以典型7B模型计算)大约需要0.5~1TOPS的算力消耗。换算下来,5万块芯片理论上可以支撑每秒约1000万~2000万次推理请求。

当然,这只是一个理论峰值。实际部署中要考虑集群利用率(通常60%~70%)、负载均衡、故障冗余等因素。保守估计,5万块芯片可以支撑每秒500万~800万次推理请求,这个量级对应的是月活数亿级用户产品的高峰并发,完全匹配豆包当前和可预见未来的增长规模。

对比一下:2025年中国AI加速卡总出货量约400万张,天数智芯自己才出了约5万张。字节一家就吃掉了天数智芯2026年预期产量的一半,这不是“试试看”的量。这说明字节对豆包的用户增长信心极强,也说明在短期乐观还是悲观的争论之间,字节选择了用真金白银投票。

二、国产推理芯片的「三叉戟」策略

如果只看“字节买了5万块天数智芯”,可能会得出一个错误的判断,字节选定了天数智芯作为主力供应商。事实上,字节的GPU供应链布局是三条腿同时走路:华为昇腾、寒武纪、天数智芯三家并行,还在考虑百度的昆仑芯。

为什么需要三家?因为英伟达被限制后,字节不打算把筹码押在任何单一国产厂商身上。每一家都有各自的长处和短板:华为昇腾强在全栈生态(芯片+框架+应用层都有),但产能和价格受制于华为自己的产品线优先级;寒武纪训练和推理都能做,但市场份额尚不足以支撑大规模供货承诺;天数智芯专攻推理,性价比突出,但客户结构集中于政府采购,商业化经验有限。

这个策略叫“三叉戟”:不让任何一家独占供应份额,哪家性能好、响应快、成本优,后续订单就往哪家倾斜。从字节的角度看,这是最理性的供应链管理,三家竞争带来更快的迭代速度和更好的议价空间。从国产芯片厂商的角度看,字节的采购是“入场券”,但不是“饭票”。

IDC数据显示,华为以81.2万张的出货量在国产阵营中遥遥领先,阿里平头哥第二,寒武纪和百度昆仑芯紧随其后。天数智芯约5万张,在国产GPGPU厂商中排在前列但绝对量不大。字节的5万块订单如果到位,将直接让天数智芯的市场份额翻倍,这才是这条新闻里最容易被忽略的数字。

三、为什么推理是国产芯片的甜区

过去两年,国产AI芯片圈讨论最多的词是“训练对标”。每一家都在拿自己的产品对标英伟达H100和B200,比拼训练吞吐量。但字节的这个订单说明了一个结构性变化:推理正在取代训练成为国产芯片的主战场。

推理和训练的逻辑完全不同。训练是一锤子买卖,模型跑通一次验收就行。推理是每天持续运转的机器,用户每发一条消息都要算一次。训练可以分批做、可以等,但推理不能等。豆包的月活用户持续增长,推理算力缺口每天都在扩大,中间没有“等技术优化好了再说”的缓冲空间。

而且推理场景对国产芯片更友好。推理框架(如vLLM、TGI、llama.cpp)大多是开源的,不绑定CUDA,国产芯片只要把算子库适配到这些框架上就能运转。生态迁移壁垒远低于训练场景,训练依赖的大规模分布式框架和PyTorch内部的各种编译优化,短期内很难在其他硬件上完美复现。

智铠芯片均价仅1.2万元,对比海外同类推理卡在中国的渠道价格(通常2万~3万元),价格优势约40%~60%。再加上国产厂商本地化技术支持和更快的响应速度,这个“性价比+服务”的组合在推理场景下非常能打。

腾讯首席战略官詹姆斯·米切尔5月说,国产AI芯片将于今年下半年实现大规模供货。英伟达CEO黄仁勋说英伟达在华份额已“基本归零”。这两句话在一起,说的其实是同一件事:国产替代在推理领域已经不是一个“行不行”的问题,而是一个“上多少量”的问题。

四、这笔账不只是字节的账

字节跳动5万块推理芯片采购的意义,远超字节和天数智芯两家公司。

对天数智芯来说,这是IPO之后的第一场大考。在此之前,它的客户以政府项目为主。政府项目的特点是单价高、验收周期长、对商业生态要求相对宽松。而字节的订单完全不同,字节会把真实的推理工作负载实打实地跑在智铠芯片上,对性能、稳定性、开发工具链、技术响应速度都会提出“产业级”要求。如果跑通了,天数智芯就完成了从“政府项目型公司”到“商业市场型公司”的跃迁。如果跑不通,这笔订单可能不会完全兑现。

对整个国产芯片生态来说,字节的采购策略意味着一个信号:互联网巨头正在用真金白银为国产芯片做压力测试。华为、寒武纪、天数智芯、昆仑芯,谁能在巨头的严苛场景下站稳脚跟,谁就能拿到后续更大规模的订单。这种“实战即检验”的模式,比任何实验室评测都有说服力。

2025年中国AI加速卡市场,国产厂商合计交付约165万张,占比41%。剩下的59%是什么?是英伟达的存量市场和渠道货。随着英伟达在华份额持续收缩、国产芯片产能爬坡,字节的这笔5万块订单只是一个开始。据IDC数据,中国AI加速卡总出货量每年还在高速增长,字节的天数智芯订单如果成功,很可能会带动更多互联网公司跟进,阿里、腾讯、百度,每一家都有自己的推理业务需要算力。

黄仁勋说英伟达在华份额“基本归零”的时候,可能没想到接盘的会是一群刚从政府项目毕业的国产芯片公司。但字节这笔订单告诉我们,毕业考试已经开始了。

© 版权声明

相关文章

暂无笔记

您必须登录才能记录笔记!
立即登录
none
暂无笔记...