动作捕捉
展开
动作捕捉概念题材相关新闻
2025年3月10日:
智元发布首个通用具身基座大模型GO-1,GO-1开创性提出Vision-Language-Latent-Action(ViLLA)架构。该架构由VLM(多模态大模型)+MOE(混合专家)组成,其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用
2025年3月10日:
智元发布首个通用具身基座大模型GO-1,GO-1开创性提出Vision-Language-Latent-Action(ViLLA)架构。该架构由VLM(多模态大模型)+MOE(混合专家)组成,其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用
