$北京君正(sz300223)$ 每秒500 token破纪录,自研LPU是英伟达GPU 10倍。
重点:不同于英伟达GPU需要依赖高速数据传输,GroQ的LPU在其系统中没有采用高带宽存储器(HBM)。它使用的是SRAM,其速度比GPU所用的存储器快约20倍。
鉴于AI的推理计算,相较于模型训练需要的数据量远小,GroQ的LPU因此更节能。在执行推理任务时,它从外部内存读取的数据更少,消耗的电量