今天市场又在传昇腾950PR的消息,把自己的碎片化观察捋一捋,不一定对,就当找个地方记下来。

互联网大厂的算力焦虑,比想象中急

再说需求端。

今年我有个很深的感受,互联网大厂抢算力,像当年抢核心地段一样。 TOKE N需求上量太快了,模型规模从千亿往万亿甚至十万亿跑,专家并行、序列并行的通信范围早就突破单台服务器了。

结果是什么?超节点服务器成了刚需。

去年下半年开始,华为、阿里、字节、