DPU崛起:继CPU、GPU之后,数据中心的“第三颗芯片”走到台前
展开
我跟你讲,数据中心这片战场,现在最缺的不是算力,是“搬运工”。
以前大家都觉得CPU是大总管,GPU是算力狂魔。但有个问题被忽略了:数据传输。
数据量太大了。GPU们嗷嗷待哺,等着数据喂进去训练。CPU忙得要死,不仅要算账,还得处理网络数据包、做加解密、搞存储虚拟化。这就好比让一个大学教授去干收发快递的活。结果就是,大概有20%到50%的CPU算力被“偷”走了,根本没用来跑业务逻辑。
于是DPU站出来了。这东西被称为继CPU和GPU之后的“第三颗主芯片”。
英伟达的一盘大棋
其实英伟达定义DPU之前,云厂商们自己就受不了了。亚马逊、微软早年就在搞智能网卡,目的很简单:给CPU减负。
直到2019年,老黄花了69亿美金拿下Mellanox。这步棋现在看是必须的。
他把网卡、ARM核、专用加速引擎揉在了一起。2020年推出的Bluefield系列,证明了一件事:把“控制平面”和“计算平面”彻底分开。
你看现在的AI集群,GPU之间互联的流量有多夸张。没有DPU调度、搬数据、做拥塞控制,大规模GPU集群的效率会直线下降。英伟达后来搞的Spectrum-X以太网平台,那个专门针对大规模GPU的SuperNIC,说白了就是给GPU集群配的专属快递员。
今年3月发布的BlueField4 STX更有意思。这东西专门解决AI推理中的“KV Cache爆炸”问题——现在大家都在卷长文本,推理时的显存瓶颈很要命。结果是Token吞吐量能提升5倍。这已经不是网卡了,这是在重构AI计算的存储逻辑。
谁在这个产业链里?
说实话,做DPU很难。难在软件生态,难在跟CPU、GPU的配合。但一旦做进去了,客户粘性非常大,因为这是基础设施的底座。
下面这几家公司,在各自环节已经有相关产品布局。
海光信息
这家做CPU的,动作很快。3月份刚和中科驭数(做DPU的)搞了战略合作。逻辑很清楚:英伟达有GPU+DPU,海光这边想凑一套CPU+DPU。这种组合思路,在数据中心里很实用。
中兴通讯
你可能觉得它是个设备商。但中兴微电子手里有自研的DPU定海芯片,支持RDMA智能网卡,还能做视频编解码加速。中兴本身就有通信设备的大盘子,芯片设计能力也在手里,DPU这块属于自然延伸。
浪潮信息
作为服务器龙头,它是英伟达方案最直接的落地者。浪潮搞的X400超级AI以太网解决方案,就是基于DPU做端网协同,还拿过创新奖。对浪潮来说,DPU不是单独卖的芯片,而是让它做出更高性能整机的核心部件。
致尚科技
这个稍微细一点。它旗下的恒扬数据,走的是FPGA路线做DPU。FPGA没专用芯片那么便宜,但灵活性高。在技术还没完全定型的阶段,这种思路反而能快速抓到一些定制化需求。
芯原股份
芯片IP授权的老玩家。它手里攒着各种高性能接口IP,而DPU里面最核心的高速互联、数据搬运,都离不开这种IP支撑。技术底座型,谁做DPU都可能需要它。
晶晨股份
它投了芯启源。芯启源是国内头部的DPU创业公司,主攻电信级和企业级的智能网卡。晶晨股份这步棋,属于通过投资来观察和布局前沿赛道。
裕太微
做通信芯片的,以太网PHY芯片已经规模量产。DPU要插在网口上,物理层传输是绕不开的底层硬件,这个环节也需要有人做。
我的判断
AI模型越来越大,数据在处理器之间流动的瓶颈,可能会比算力本身更难突破。这不仅仅是国产替代的故事,而是全球计算架构正在发生的一次底层重构。谁在“连接”和“卸载”上拿出更扎实的方案,谁就在下一阶段拥有更强的话语权。
风险提示:本文纯属产业技术讨论,提到的公司仅作为案例分析。半导体行业技术路线迭代快,新产品存在市场推广不及预期的可能性。
以前大家都觉得CPU是大总管,GPU是算力狂魔。但有个问题被忽略了:数据传输。
数据量太大了。GPU们嗷嗷待哺,等着数据喂进去训练。CPU忙得要死,不仅要算账,还得处理网络数据包、做加解密、搞存储虚拟化。这就好比让一个大学教授去干收发快递的活。结果就是,大概有20%到50%的CPU算力被“偷”走了,根本没用来跑业务逻辑。
于是DPU站出来了。这东西被称为继CPU和GPU之后的“第三颗主芯片”。
英伟达的一盘大棋
其实英伟达定义DPU之前,云厂商们自己就受不了了。亚马逊、微软早年就在搞智能网卡,目的很简单:给CPU减负。
直到2019年,老黄花了69亿美金拿下Mellanox。这步棋现在看是必须的。
他把网卡、ARM核、专用加速引擎揉在了一起。2020年推出的Bluefield系列,证明了一件事:把“控制平面”和“计算平面”彻底分开。
你看现在的AI集群,GPU之间互联的流量有多夸张。没有DPU调度、搬数据、做拥塞控制,大规模GPU集群的效率会直线下降。英伟达后来搞的Spectrum-X以太网平台,那个专门针对大规模GPU的SuperNIC,说白了就是给GPU集群配的专属快递员。
今年3月发布的BlueField4 STX更有意思。这东西专门解决AI推理中的“KV Cache爆炸”问题——现在大家都在卷长文本,推理时的显存瓶颈很要命。结果是Token吞吐量能提升5倍。这已经不是网卡了,这是在重构AI计算的存储逻辑。
谁在这个产业链里?
说实话,做DPU很难。难在软件生态,难在跟CPU、GPU的配合。但一旦做进去了,客户粘性非常大,因为这是基础设施的底座。
下面这几家公司,在各自环节已经有相关产品布局。
海光信息
这家做CPU的,动作很快。3月份刚和中科驭数(做DPU的)搞了战略合作。逻辑很清楚:英伟达有GPU+DPU,海光这边想凑一套CPU+DPU。这种组合思路,在数据中心里很实用。
中兴通讯
你可能觉得它是个设备商。但中兴微电子手里有自研的DPU定海芯片,支持RDMA智能网卡,还能做视频编解码加速。中兴本身就有通信设备的大盘子,芯片设计能力也在手里,DPU这块属于自然延伸。
浪潮信息
作为服务器龙头,它是英伟达方案最直接的落地者。浪潮搞的X400超级AI以太网解决方案,就是基于DPU做端网协同,还拿过创新奖。对浪潮来说,DPU不是单独卖的芯片,而是让它做出更高性能整机的核心部件。
致尚科技
这个稍微细一点。它旗下的恒扬数据,走的是FPGA路线做DPU。FPGA没专用芯片那么便宜,但灵活性高。在技术还没完全定型的阶段,这种思路反而能快速抓到一些定制化需求。
芯原股份
芯片IP授权的老玩家。它手里攒着各种高性能接口IP,而DPU里面最核心的高速互联、数据搬运,都离不开这种IP支撑。技术底座型,谁做DPU都可能需要它。
晶晨股份
它投了芯启源。芯启源是国内头部的DPU创业公司,主攻电信级和企业级的智能网卡。晶晨股份这步棋,属于通过投资来观察和布局前沿赛道。
裕太微
做通信芯片的,以太网PHY芯片已经规模量产。DPU要插在网口上,物理层传输是绕不开的底层硬件,这个环节也需要有人做。
我的判断
AI模型越来越大,数据在处理器之间流动的瓶颈,可能会比算力本身更难突破。这不仅仅是国产替代的故事,而是全球计算架构正在发生的一次底层重构。谁在“连接”和“卸载”上拿出更扎实的方案,谁就在下一阶段拥有更强的话语权。
风险提示:本文纯属产业技术讨论,提到的公司仅作为案例分析。半导体行业技术路线迭代快,新产品存在市场推广不及预期的可能性。
话题与分类:
主题股票:
主题概念:
声明:遵守相关法律法规,所发内容承担法律责任,倡导理性交流,远离非法证券活动,共建和谐交流环境!
