①不需要预先的地图,结合实时的视觉图像和激光雷达信息,机器人可实时感知环境;
②NaVILA还进一步将导航技术从轮式扩展到了足式机器人,研究人员对宇树Go2机器狗和G1人形机器人进行了实测;
③NVILA模型具有强大的多模态推理能力。

日前,加州大学研究人员和英伟达共同发布了新的视觉语言模型“NaVILA”。亮点在于,NaVILA模型为机器人导航提供了一种新方案。

视觉语言模型(VLM)是一种