0705看图
展开

反馈
相关文章
创作者筛选
已为您筛选包含的作者
一、行业需求端:算力总需求持续高增,增长被硬件/电力硬性锁死
1. 整体需求无下滑,市场流行“省token”只是企业降成本手段,整体调用总量持续走高;
2. Anthropic(A厂)是谷歌TPU最大客户,占用GCP超30%算力,峰值达40%,资源拉满,谷歌甚至关停自身业务优先供给;
3. A厂收入增速明显放缓,核心瓶颈不是客户,是谷歌TPU供给跟不上,只能从AWS、微软额外拿算力才能恢复高速增长;
4. 全行业无真正闲置算力,Meta所谓对外出租算力,本质是拆除老旧V6芯片置换新V7/V8后腾出的存量,并非富余产能。
二、模型架构分水岭:小MoE专家淘汰,大专家架构形成业绩正循环
1. 两代架构逻辑
1. 早期:缺少长程高质量数据,依赖LongCOT深度推演,采用大量小专家MoE,适配数学、物理固定规则任务;
2. 当下:海量用户长反馈数据落地,大专家架构优势凸显,单专家维度更大,能完整消化代码、动态业务数据;
2. 厂商差距
1. Anthropic2025年押注大专家路线,Fable5模型代码能力大幅领先OpenA IGPT -5.6;
2. OpenAI短板:小专家过多、单模型维度不足,即便Codex用户基数庞大,模型迭代提升极小;
3. 投入产出:不含训练成本Anthropic每1美元算力赚2.1美元,OpenAI仅1.6美元;计入训练成本OpenAI跌至0.68美元,低于盈亏线,盈利能力差距巨大。
三、芯片与算力硬件:TPU成本碾压英伟达,短期靠换卡扩容,2028产能爆发
1. 成本对比
1. TPUV7机架BOM约150万美元,英伟达GB200机架324万美元,TPU成本近乎腰斩;V8i单卡性能超GB300,联发科代工具备降价空间;
2. Cerebras晶圆芯片成本偏高,短期竞争力不足;
2. 短期扩容方案(2026-2027)
1. 数据中心、电力是第一瓶颈,而非芯片产能;大量新TPU拿到后无电源可用;
2. 行业统一方案:拆除老旧V6芯片,替换V7/V8新卡,不新建机房;每年新增600-800万片TPU;
3. 长期产能拐点:2028谷歌+台积电专属TPU工厂投产,算力产能大规模释放。
四、电力、存储两大关键配套约束
1. 电力缺口加剧,首次出现“有卡无电”;GCP计划大幅上调短期算力租赁价(涨幅超30%),长协大客户(苹果/三星)不受影响;
2. 存储资源优先级: DRAM >HBM>SSD>HDD
1. 当前TPU机房HBM:DRAM配比仅1:1~1:2,理论最优1:10,扩容DRAM是行业核心降本增效方向;
2. 冷热存储由系统自动调度,HDD仅用于冷数据,无法缓解训练端DRAM紧缺问题。
五、短期行业核心结论(2026年内)
1. 算力供需持续失衡,算力租赁价格上行;
2. 模型路线分化:大专家架构厂商持续拉开性能、盈利差距,OpenAI、谷歌老架构追赶成本极高;
3. 硬件主线:存量机房老旧芯片替换、DRAM扩容是资本开支核心;
4. 2028年是算力供给拐点,在此之前算力稀缺逻辑持续兑现。