Claude Fable 5被禁、智谱GLM-5.2开源:国产大模型与算力的真实处境
展开
Fable5一夜“消失”,国产模型与算力的真实处境
说实话,看到Anthropic那则公告的时候,我第一反应不是震惊,居然是“终于来了”。
这种感觉怎么说呢,就像你知道头顶那把剑迟早要掉,结果它真在周五晚上砸下来了。Claude Fable5和Mythos5对全球“外国人”全面禁售。注意这个措辞,哪怕你是Anthropic的外籍员工,人在美国,也不让用。
这已经不是单纯的贸易壁垒了。这是直接把先进模型当成了管制物项。
当“最强外挂”突然断供
圈里人都懂,虽然Claude官方没进内地,但之前的版本大家总有“野路子”用。特别是写代码和长文本逻辑,Fable5几乎是公认的T0级别参考工具。
现在路彻底焊死了。而且美方给出的理由是发现了“越狱”方法,怕被用来获取非法访问权限。不管这理由站不站得住脚,结果只有一个:国内搞AI研发的团队,手头一个重要的参考工具被收回了。
这时候,压力给到了国产这边。
很微妙的是,就在禁令发出的第二天,智谱掐着点发了公告。6月13日下午5:21,GLM-5.2全量开放。
5:21这个时间点,很难不让人联想。
智谱这次倒是没含糊,直接说这是他们“迄今能力最强的开源模型”。1M上下文,重点强化的就是编程和长程任务处理。最关键的是,它允许开发者用MIT协议去商用和修改。
智谱这波打的是“开放牌”。
那边用规则卡脖子,这边就用开源争取开发者。宣言里那句“前沿智能不应只属于少数人,也不应被少数规则随时收回”在这个节点上,确实有它的分量。
模型要跑起来,算力是绕不过去的“地基”
模型开源了,算法有了,谁来算?
这才是真正硬核的部分。Fable5被禁,短期内最大的困境不是“写不出同样的代码”,而是我们得用国产算力去追赶甚至接近它的效果。
以海光信息为例,这家公司的DCU产品走的是“类 CUDA ”路线。做个简单解释:现在绝大多数的AI训练框架都是基于CUDA生态写的,从头另起炉灶的迁移成本高得吓人。海光信息的策略是让你把代码做少量修改就能跑起来,这对企业来说意味着更低的切换成本。
不只是硬件,他们近期在推的“HSL”互联协议也值得一说。大模型训练不是单卡作战,几万张卡连在一起,通信瓶颈往往是最大的拦路虎。CPU和DCU之间的协同做顺了,对做大模型训练的企业来说,就是实打实的效率提升。
再看整机环节。浪潮信息作为国内服务器厂商,在算力基础设施的交付中处于关键位置。芯片设计出来,最终要通过服务器整机能力形成可部署的产品。这个环节的供应链稳定性和交付能力,在整个国产算力链条里都扮演着重要角色。
不仅仅是老面孔,还有新的产业变量
天数智芯和壁仞科技近期在资本市场有了新进展。这两家公司在国产通用GPU领域也有各自的布局。虽然当前的产品成熟度和市场占有率还在爬坡阶段,但在国产算力这个赛道里,多一个可选的供应商,对下游客户来说就意味着多一个方案储备。
特别是天数智芯,近期披露了下一阶段的收入目标。如果这样的目标能够落地,说明国产算力产品在商业化和生态适配方面,正在加速跑通从“实验室”到“客户机房”的流程。
还有做互连芯片的盛科通信。很多人盯着GPU算力,却容易忽略大模型训练里“互连”的重要性。盛科通信做的是以太网交换芯片,这是组算力集群的基础部件。这类底层互连硬件是智算中心建设中的关键配套之一。
一些真实的观察
当然,我们也没必要过度美化现状。
国产算力目前的处境,可以概括为“能用”,但离“极致好用”还有距离。同样的训练任务,可能需要投入更多的人力和时间去调优、去适配。以前大家图省事,能直接用H100的就直接用,能调用Claude的就调用Claude。
现在Fable5被禁,相当于把这条“捷径”暂时关闭了。
这是坏事,但也提供了一个契机:它倒逼更多开发者和企业必须从“依赖惯性”转向“尝试国产”。更多用户的使用和反馈,会推动智谱这类模型厂商的迭代速度加快,推动海光信息这类算力厂商的软件栈优化提速。
风险提示: 技术追赶需要时间,国产算力在软件生态、先进制程等方面仍面临客观挑战。市场竞争激烈,研发投入巨大,商业化落地存在不确定性。本文为科技产业观察,不构成任何证券投资建议。文中提及上市公司仅作产业案例分析,不代表任何投资价值判断。本文不涉及任何证券研究分析,亦不构成对上市公司的业绩预测或估值判断。
说实话,看到Anthropic那则公告的时候,我第一反应不是震惊,居然是“终于来了”。
这种感觉怎么说呢,就像你知道头顶那把剑迟早要掉,结果它真在周五晚上砸下来了。Claude Fable5和Mythos5对全球“外国人”全面禁售。注意这个措辞,哪怕你是Anthropic的外籍员工,人在美国,也不让用。
这已经不是单纯的贸易壁垒了。这是直接把先进模型当成了管制物项。
当“最强外挂”突然断供
圈里人都懂,虽然Claude官方没进内地,但之前的版本大家总有“野路子”用。特别是写代码和长文本逻辑,Fable5几乎是公认的T0级别参考工具。
现在路彻底焊死了。而且美方给出的理由是发现了“越狱”方法,怕被用来获取非法访问权限。不管这理由站不站得住脚,结果只有一个:国内搞AI研发的团队,手头一个重要的参考工具被收回了。
这时候,压力给到了国产这边。
很微妙的是,就在禁令发出的第二天,智谱掐着点发了公告。6月13日下午5:21,GLM-5.2全量开放。
5:21这个时间点,很难不让人联想。
智谱这次倒是没含糊,直接说这是他们“迄今能力最强的开源模型”。1M上下文,重点强化的就是编程和长程任务处理。最关键的是,它允许开发者用MIT协议去商用和修改。
智谱这波打的是“开放牌”。
那边用规则卡脖子,这边就用开源争取开发者。宣言里那句“前沿智能不应只属于少数人,也不应被少数规则随时收回”在这个节点上,确实有它的分量。
模型要跑起来,算力是绕不过去的“地基”
模型开源了,算法有了,谁来算?
这才是真正硬核的部分。Fable5被禁,短期内最大的困境不是“写不出同样的代码”,而是我们得用国产算力去追赶甚至接近它的效果。
以海光信息为例,这家公司的DCU产品走的是“类 CUDA ”路线。做个简单解释:现在绝大多数的AI训练框架都是基于CUDA生态写的,从头另起炉灶的迁移成本高得吓人。海光信息的策略是让你把代码做少量修改就能跑起来,这对企业来说意味着更低的切换成本。
不只是硬件,他们近期在推的“HSL”互联协议也值得一说。大模型训练不是单卡作战,几万张卡连在一起,通信瓶颈往往是最大的拦路虎。CPU和DCU之间的协同做顺了,对做大模型训练的企业来说,就是实打实的效率提升。
再看整机环节。浪潮信息作为国内服务器厂商,在算力基础设施的交付中处于关键位置。芯片设计出来,最终要通过服务器整机能力形成可部署的产品。这个环节的供应链稳定性和交付能力,在整个国产算力链条里都扮演着重要角色。
不仅仅是老面孔,还有新的产业变量
天数智芯和壁仞科技近期在资本市场有了新进展。这两家公司在国产通用GPU领域也有各自的布局。虽然当前的产品成熟度和市场占有率还在爬坡阶段,但在国产算力这个赛道里,多一个可选的供应商,对下游客户来说就意味着多一个方案储备。
特别是天数智芯,近期披露了下一阶段的收入目标。如果这样的目标能够落地,说明国产算力产品在商业化和生态适配方面,正在加速跑通从“实验室”到“客户机房”的流程。
还有做互连芯片的盛科通信。很多人盯着GPU算力,却容易忽略大模型训练里“互连”的重要性。盛科通信做的是以太网交换芯片,这是组算力集群的基础部件。这类底层互连硬件是智算中心建设中的关键配套之一。
一些真实的观察
当然,我们也没必要过度美化现状。
国产算力目前的处境,可以概括为“能用”,但离“极致好用”还有距离。同样的训练任务,可能需要投入更多的人力和时间去调优、去适配。以前大家图省事,能直接用H100的就直接用,能调用Claude的就调用Claude。
现在Fable5被禁,相当于把这条“捷径”暂时关闭了。
这是坏事,但也提供了一个契机:它倒逼更多开发者和企业必须从“依赖惯性”转向“尝试国产”。更多用户的使用和反馈,会推动智谱这类模型厂商的迭代速度加快,推动海光信息这类算力厂商的软件栈优化提速。
风险提示: 技术追赶需要时间,国产算力在软件生态、先进制程等方面仍面临客观挑战。市场竞争激烈,研发投入巨大,商业化落地存在不确定性。本文为科技产业观察,不构成任何证券投资建议。文中提及上市公司仅作产业案例分析,不代表任何投资价值判断。本文不涉及任何证券研究分析,亦不构成对上市公司的业绩预测或估值判断。
话题与分类:
主题股票:
主题概念:
声明:遵守相关法律法规,所发内容承担法律责任,倡导理性交流,远离非法证券活动,共建和谐交流环境!
