Al推理芯片多重催化!概念股!云天励飞!
展开
产业的底层逻辑正发生深刻逆转。过去,算力与资本主要集中在模型 “训练” 端,行业聚焦于打造更大规模的 AI 模型;如今,随着生成式 AI 应用的普及和智能体工作流的爆发,推理算力(Inference)需求呈指数级增长,据行业预测,短期内将实现百倍级跃升
英特尔陈立武:随着AI从训练转向推理,CPU与GPU配比或可达4:1
获悉,在数据中心CPU需求大爆发以及18A先进芯片制程业务步入增长轨迹的大背景之下,华尔街金融巨头们近日对于x86架构CPU超级巨头——英特尔(INTC.US)的看涨情绪可谓愈发浓厚。花旗集团对于英特尔目标价从95美元大幅上调至130美元,另一知名投资机构Melius Research更是将英特尔目标价从100美元上调至150美元,凸显出“数据中心CPU需求狂潮+18A先进芯片制程利润前景持续改善”正在共同点燃并推进英特尔的超级牛市叙事。
据了解,在有媒体报道称英特尔已要求PC制造商们使用基于其18A先进芯片生产工艺制造的芯片产品之际,华尔街投资巨头Wedbush Securities认为,这是这家半导体制造巨头正在优先考虑扩张其利润率的积极信号。
阿里巴巴发布可同时承担训练和推理任务的新款人工智能(AI)芯片,进一步增强人工智能各个环节的布局。
阿里巴巴旗下的芯片设计公司平头哥5月20日在杭州举行的一场活动中发布了名为真武M890的新款AI处理器,配备144GB的GPU内存,尤其适合智能体相关任务。阿里巴巴计划每年都会升级真武芯片,升级步伐大致与行业领军者英伟达一致。
阿里巴巴首席执行官吴泳铭去年承诺,公司将致力于打造“全栈”AI能力,覆盖从芯片设计、服务器运行到模型开发和云服务支持的各个环节。基于新款真武芯片的磐久AL128超节点服务器可以将128张AI芯片整合为一台高性能服务器。阿里巴巴还计划推动芯片设计业务上市。
阿里巴巴5月20日表示,平头哥真武系列芯片已累计出货56万片,客户数超400家。平头哥已揽到的客户包括中国联通,以及一些汽车制造商和金融服务公司。
阿里巴巴还发布了千问模型Qwen3.7-Max,该模型针对编程和智能体任务进行了优化
国际巨头动态:Cerebras IPO引爆晶圆级芯片热度
美国AI芯片初创公司Cerebras Systems于2026年5月中旬完成IPO,其独特的晶圆级计算架构成为挑战英伟达的重要力量:
市场表现:Cerebras以约488亿美元的估值登陆纳斯达克,募资上限约48亿美元,认购订单超过发行数量的20倍,反映出资本市场对专用推理芯片的高度看好。
技术优势:其核心产品WSE-3采用整片晶圆设计,面积是英伟达B200的56倍,片上SRAM内存容量是B200的250倍,内存带宽更是达到B200的2625倍。这种设计彻底消除了传统GPU在推理Decode阶段的“内存墙”瓶颈,实测在Llama 3.3 70B等模型上的推理速度远超主流GPU方案。
客户背书:OpenAI与Cerebras达成大额算力采购合作,AWS也选择其作为Bedrock推理加速层的核心供应商。
3. 行业趋势:ASIC与CPU在推理时代地位上升
随着AI应用从大模型训练转向大规模部署,芯片架构正在发生结构性变化:
ASIC定制化崛起:2026年第一季度,谷歌TPU在其AI服务器出货占比飙升至78%。OpenAI宣布部署博通定制ASIC构建10吉瓦算力集群,单算力成本降低约35%。高盛预测,2026年ASIC占AI芯片比例将升至40%,几乎与GPU平分秋色。
CPU迎来“文艺复兴”:英特尔CEO陈立武指出,随着Agentic AI(智能体AI)的爆发,算力瓶颈从矩阵计算转向控制流和任务编排,导致数据中心CPU需求激增。CPU与GPU的配置比例正从1:8向1:1甚至4:1靠拢,英特尔凭借18A先进制程良率提升,在高性能CPU领域重新获得市场关注。
特斯拉聚焦推理:特斯拉简化内部芯片研发,解散Dojo超级计算机团队,集中资源开发用于自动驾驶和人形机器人的下一代AI5、AI6推理芯片,预计AI5将于2026年底生产。官媒
4. 国产其他厂商进展
云天励飞:公司在互动平台表示,针对大模型推理设计的下一代芯片DeepVerse进度有序推进。其已中标湛江市I渗透支撑新质生产力基础设施建设项目,将基于自研国产AI推理加速卡参与建设AI推理算力集群。
政策环境:2026年5月,中国出台新政策要求国内主要芯片制造商使用的硅晶圆中,超过70%必须来自本土供应商,旨在强化供应链自主可控,间接推动国产芯片制造与配套产业的发展。
总结:当前推理芯片市场呈现“专用化、定制化、全栈化”特征。英伟达虽仍占主导,但面临Cerebras(晶圆级)、Groq/博通(ASIC)以及阿里平头哥(云端全栈)的多维度挑战。对于企业和开发者而言,选择芯片时需更关注其在特定Agent场景下的能效比、延迟及软件生态兼容性。
司回答表示,尊敬的投资者,您好!公司Chiplet架构能够有效提升单芯片算力密度,优化芯片生产良率,进而大幅压缩芯片整体生产成本。公司深耕AI推理芯片领域,目前IP授权并非核心业务。关于公司的业务规划,请持续关注公司在上交所网站及指定媒体依法合规披露的定期报告等公开信息,谢谢!
有投资者向云天励飞-U(688343.SH)提问,注意到公司确立了独特的GPNPU技术路线(通用计算+高效NPU+3D堆叠)。在当前算力国产化替代的浪潮下,相较于传统的GPGPU,公司的GPNPU架构在能效比和成本把控上有何“杀手锏”?面对未来三年的AI推理芯片爆发期,公司如何凭借“算力积木”架构守住技术护城河,实现从“适应市场”到“定义标准”的跨越?
5月20日,公司回答表示,公司的GPNPU通过“通用计算+高效NPU+3D堆叠”的架构,把GPU的灵活性、NPU的高能效和近存计算的数据供给能力结合起来,使算力不再只是峰值堆叠,而是围绕推理SLA进行系统级优化:第一,用NPU级矩阵与Attention加速提高有效算力利用率;第二,用3D堆叠和近存数据通路降低KVCache、长上下文、视频生成等场景的数据搬运成本;第三,用算力积木架构,把芯片、存储、互联、板卡、服务器、超节点和软件组合成标准化产品单元,从而在不同市场以不同形态快速落地。
真武M890是阿里云端旗舰芯,云天励飞是平头哥边缘AI战略伙伴,同属阿里国产算力生态,M890发布强化了“云-边”协同逻辑,利好云天励飞生态地位与订单预期。
英特尔陈立武:随着AI从训练转向推理,CPU与GPU配比或可达4:1
获悉,在数据中心CPU需求大爆发以及18A先进芯片制程业务步入增长轨迹的大背景之下,华尔街金融巨头们近日对于x86架构CPU超级巨头——英特尔(INTC.US)的看涨情绪可谓愈发浓厚。花旗集团对于英特尔目标价从95美元大幅上调至130美元,另一知名投资机构Melius Research更是将英特尔目标价从100美元上调至150美元,凸显出“数据中心CPU需求狂潮+18A先进芯片制程利润前景持续改善”正在共同点燃并推进英特尔的超级牛市叙事。
据了解,在有媒体报道称英特尔已要求PC制造商们使用基于其18A先进芯片生产工艺制造的芯片产品之际,华尔街投资巨头Wedbush Securities认为,这是这家半导体制造巨头正在优先考虑扩张其利润率的积极信号。
阿里巴巴发布可同时承担训练和推理任务的新款人工智能(AI)芯片,进一步增强人工智能各个环节的布局。
阿里巴巴旗下的芯片设计公司平头哥5月20日在杭州举行的一场活动中发布了名为真武M890的新款AI处理器,配备144GB的GPU内存,尤其适合智能体相关任务。阿里巴巴计划每年都会升级真武芯片,升级步伐大致与行业领军者英伟达一致。
阿里巴巴首席执行官吴泳铭去年承诺,公司将致力于打造“全栈”AI能力,覆盖从芯片设计、服务器运行到模型开发和云服务支持的各个环节。基于新款真武芯片的磐久AL128超节点服务器可以将128张AI芯片整合为一台高性能服务器。阿里巴巴还计划推动芯片设计业务上市。
阿里巴巴5月20日表示,平头哥真武系列芯片已累计出货56万片,客户数超400家。平头哥已揽到的客户包括中国联通,以及一些汽车制造商和金融服务公司。
阿里巴巴还发布了千问模型Qwen3.7-Max,该模型针对编程和智能体任务进行了优化
国际巨头动态:Cerebras IPO引爆晶圆级芯片热度
美国AI芯片初创公司Cerebras Systems于2026年5月中旬完成IPO,其独特的晶圆级计算架构成为挑战英伟达的重要力量:
市场表现:Cerebras以约488亿美元的估值登陆纳斯达克,募资上限约48亿美元,认购订单超过发行数量的20倍,反映出资本市场对专用推理芯片的高度看好。
技术优势:其核心产品WSE-3采用整片晶圆设计,面积是英伟达B200的56倍,片上SRAM内存容量是B200的250倍,内存带宽更是达到B200的2625倍。这种设计彻底消除了传统GPU在推理Decode阶段的“内存墙”瓶颈,实测在Llama 3.3 70B等模型上的推理速度远超主流GPU方案。
客户背书:OpenAI与Cerebras达成大额算力采购合作,AWS也选择其作为Bedrock推理加速层的核心供应商。
3. 行业趋势:ASIC与CPU在推理时代地位上升
随着AI应用从大模型训练转向大规模部署,芯片架构正在发生结构性变化:
ASIC定制化崛起:2026年第一季度,谷歌TPU在其AI服务器出货占比飙升至78%。OpenAI宣布部署博通定制ASIC构建10吉瓦算力集群,单算力成本降低约35%。高盛预测,2026年ASIC占AI芯片比例将升至40%,几乎与GPU平分秋色。
CPU迎来“文艺复兴”:英特尔CEO陈立武指出,随着Agentic AI(智能体AI)的爆发,算力瓶颈从矩阵计算转向控制流和任务编排,导致数据中心CPU需求激增。CPU与GPU的配置比例正从1:8向1:1甚至4:1靠拢,英特尔凭借18A先进制程良率提升,在高性能CPU领域重新获得市场关注。
特斯拉聚焦推理:特斯拉简化内部芯片研发,解散Dojo超级计算机团队,集中资源开发用于自动驾驶和人形机器人的下一代AI5、AI6推理芯片,预计AI5将于2026年底生产。官媒
4. 国产其他厂商进展
云天励飞:公司在互动平台表示,针对大模型推理设计的下一代芯片DeepVerse进度有序推进。其已中标湛江市I渗透支撑新质生产力基础设施建设项目,将基于自研国产AI推理加速卡参与建设AI推理算力集群。
政策环境:2026年5月,中国出台新政策要求国内主要芯片制造商使用的硅晶圆中,超过70%必须来自本土供应商,旨在强化供应链自主可控,间接推动国产芯片制造与配套产业的发展。
总结:当前推理芯片市场呈现“专用化、定制化、全栈化”特征。英伟达虽仍占主导,但面临Cerebras(晶圆级)、Groq/博通(ASIC)以及阿里平头哥(云端全栈)的多维度挑战。对于企业和开发者而言,选择芯片时需更关注其在特定Agent场景下的能效比、延迟及软件生态兼容性。
司回答表示,尊敬的投资者,您好!公司Chiplet架构能够有效提升单芯片算力密度,优化芯片生产良率,进而大幅压缩芯片整体生产成本。公司深耕AI推理芯片领域,目前IP授权并非核心业务。关于公司的业务规划,请持续关注公司在上交所网站及指定媒体依法合规披露的定期报告等公开信息,谢谢!
有投资者向云天励飞-U(688343.SH)提问,注意到公司确立了独特的GPNPU技术路线(通用计算+高效NPU+3D堆叠)。在当前算力国产化替代的浪潮下,相较于传统的GPGPU,公司的GPNPU架构在能效比和成本把控上有何“杀手锏”?面对未来三年的AI推理芯片爆发期,公司如何凭借“算力积木”架构守住技术护城河,实现从“适应市场”到“定义标准”的跨越?
5月20日,公司回答表示,公司的GPNPU通过“通用计算+高效NPU+3D堆叠”的架构,把GPU的灵活性、NPU的高能效和近存计算的数据供给能力结合起来,使算力不再只是峰值堆叠,而是围绕推理SLA进行系统级优化:第一,用NPU级矩阵与Attention加速提高有效算力利用率;第二,用3D堆叠和近存数据通路降低KVCache、长上下文、视频生成等场景的数据搬运成本;第三,用算力积木架构,把芯片、存储、互联、板卡、服务器、超节点和软件组合成标准化产品单元,从而在不同市场以不同形态快速落地。
真武M890是阿里云端旗舰芯,云天励飞是平头哥边缘AI战略伙伴,同属阿里国产算力生态,M890发布强化了“云-边”协同逻辑,利好云天励飞生态地位与订单预期。

话题与分类:
主题股票:
主题概念:
声明:遵守相关法律法规,所发内容承担法律责任,倡导理性交流,远离非法证券活动,共建和谐交流环境!
