当前位置:诺佳网 > 电子/半导体 > 机器人 >

深度解读GR00T N1:英伟达开源人形机器人功能模型

时间:2025-03-20 | 栏目:机器人 | 点击:

GR00T N1 由 NVIDIA 推出,是全球首个开源且完全可定制的通用人形机器人基础模型。其技术架构受人类认知原理启发,采用双系统协同设计


在 NVIDIA ,我们正在开发 AI 解决方案,使通用人形机器人能够理解人类世界、遵循语言指令并执行各种任务。强大的视觉-语言-作 (VLA) 模型对于此类高级功能至关重要。为此,我们开发了 GR00T N1,这是一种在多样化数据集上训练的通用机器人模型,其中包括以自我为中心的人类视频、真实和模拟的机器人轨迹以及合成数据。
GR00T N1 在多个机器人实施例的仿真基准测试中优于最先进的仿真学习模型。此外,它还展示了在家务中对 Fourier GR-1 和 1X 人形机器人进行有效的语言条件双手作。
为了帮助物理 AI 构建者解决我们社会最关键的问题,我们通过 NVIDIA ISAAC GR00T 提供宽容的许可证,使我们的模型成为轻量级的。

作者
朱玉可
Linxi “Jim” 范
NVIDIA GEAR 团队

出版日期
2025 年 3 月 17 日星期一
论文下载:
*附件:GR00T_1_Whitepaper:GR00T N1 An Open Foundation Model for Generalist.pdf

研究领域
人工智能和机器学习
自动驾驶汽车
生成式 AI
物理 AI
机器人


1. 技术架构与核心原理

GR00T N1是全球首款开源人形机器人通用基础模型,其核心架构灵感来源于人类认知的双系统理论:

这种架构通过端到端的单神经网络设计,直接从视觉输入到动作输出,简化了传统机器人控制中的复杂层级结构,提升了执行效率。

2. 数据策略与训练方法

GR00T N1的训练数据融合了 真实人类操作视频合成数据真实机器人遥操作轨迹 ,形成“数据金字塔”:

训练中结合 模仿学习 (从人类视频中提取动作令牌)与 强化学习 (在模拟环境中优化策略),大幅提升模型的泛化能力。测试显示,合成数据与真实数据结合使性能提升40%。

3. 功能亮点与性能突破

GR00T N1项目地址

4. 开源生态与行业变革

5. 战略意义与未来展望

结语

GR00T N1不仅是技术突破,更是行业生态重构的起点。其开源模式将催生更多创新应用,推动人形机器人从实验室走向家庭、工厂和公共服务领域。随着英伟达与DeepMind、迪士尼等巨头的合作深化(如Newton物理引擎项目),通用机器人时代已拉开序幕。开发者、企业及投资者需抓住这一变革机遇,探索AI与物理世界的深度融合。

您可能感兴趣的文章:

相关文章