机器人学习

在仿真中训练机器人策略。

Boston Dynamics

工作负载

加速计算工具和技术
数据中心/云
机器人
仿真/建模/设计

行业

医疗健康和生命科学
制造业
零售/快消品
智能城市/空间

业务目标

创新
投资回报

产品

NVIDIA Isaac GR00T
NVIDIA Isaac Lab
NVIDIA Isaac Sim
NVIDIA Jetson AGX
NVIDIA Omniverse

概述
技术运用
生态系统

构建通用机器人策略

预编程机器人使用固定指令在设定环境中运行，这限制了其对意外变化的适应能力。

AI 机器人通过基于仿真的学习解决了这些限制，使它们能够在动态条件下自主感知、规划和行动。通过机器人学习，它们可以利用学习到的策略（导航、操作等行为集）来获取和完善新技能，以改善它们在各种情况下的决策能力。

基于仿真的机器人学习的优势

灵活性和可扩展性

使用来自机器人捕获的真实数据和仿真中的合成数据的各种数据源，针对真实场景迭代、优化和部署机器人策略。这适用于任何机器人具身，如自主移动机器人 (AMR)、机械臂和人形机器人。基于“sim-first”的方法还可以让您快速并行训练数百或数千个机器人实例。

加速技能开发

在仿真环境中训练机器人以适应新的任务变化，而无需对物理机器人硬件重新编程。

物理精准的环境

轻松模拟物理因素，例如物体相互作用（刚性或可变形）、摩擦等，以显著减少仿真与现实的差距。

安全的验证环境

测试潜在的危险场景，而不会危及人员安全或损坏设备。

降低成本

通过生成大量合成数据、在仿真环境中验证经过训练的机器人策略并加速在机器人上部署，避免真实世界中的数据采集和标记成本的负担。

机器人学习算法

机器人学习算法（例如模仿学习或加强学习）可以帮助机器人泛化学习技能并在不断变化或新颖的环境中提高性能。有若干学习技术包括：

强化学习：一种试错方法，机器人将根据其采取的行动得到奖励或惩罚。
模仿学习：机器人可以从人类的任务演示中学习。
监督式学习：可以使用标记数据训练机器人以学习执行特定任务。
扩散策略：机器人使用生成式模型来构建和优化机器人操作，以获得期望的结果。
自我监督式学习：当已标记的数据集有限时，机器人可以根据未标记的数据生成自己的训练标签，以提取有意义的信息。

快速链接

什么是机器人学习？

什么是强化学习？

三台计算机解决方案：助力 AI 机器人开发新浪潮

教会机器人学习和适应

典型的端到端机器人工作流包括数据处理、模型训练、在仿真环境中进行验证以及部署真实机器人上。

数据处理：为了弥补数据缺口，您可以考虑将整个互联网上的数据、合成数据和实时机器人数据相结合，获得多样化的高质量数据源。

在仿真环境中进行训练和验证：机器人需要针对任务定义的场景进行训练和部署，并且需要真实世界状况的精确虚拟表示。NVIDIA Isaac™ Lab 开源框架可通过在模块化方法中使用强化学习和模拟学习技术，帮助训练机器人策略。Isaac Lab 还可与 NVIDIA Isaac Sim™ 或 MuJoCo 开发者仿真平台配合使用，以快速进行原型设计并部署机器人策略。

机器人完成训练后，就可以在基于 NVIDIA Omniverse™ 构建的参考机器人仿真应用 Isaac Sim 中对机器人性能进行验证。

部署到真实机器人上：训练后的机器人策略和 AI 模型可以部署到 NVIDIA Jetson™ 机载计算机上，为自主运行提供必要的性能和功能安全性。

面向人形机器人开发者的 NVIDIA Isaac GR00T

模仿学习是机器人学习的一个子集，在此期间，人形机器人可以通过观察和模仿人类专家的演示来获得新技能。但在现实世界中，收集这些广泛的高质量数据集却既繁琐、耗时，又成本高昂。

NVIDIA Isaac GR00T 为人形机器人开发者提供了机器人基础模型、数据工作流和仿真框架，有助于应对这些挑战。

基础模型

Isaac GR00T N 开源基础模型是通用人形机器人推理和技能的理想选择。这种跨具身本体模型接受包括语言和图像在内的多模态输入，在不同环境中执行操作任务。

合成数据生成流

NVIDIA Isaac GR00T-Dreams blueprint 帮助生成大量合成运动，可以教会机器人新的行为以及如何适应不断变化的环境。

开发人员可以先为他们的机器人进行 Cosmos Predict 2 世界基础模型 (WFM) 的后训练。然后，使用单张图片作为输入，GR00T-Dreams 可以帮助生成机器人在新环境中执行新任务的多个视频。之后，该 blueprint 会提取动作 token ——这些经过压缩、易于理解的数据片段，用于教导机器人如何执行这些新任务。

GR00T-Dreams blueprint 是对 Isaac GR00T-Mimic blueprint的补充。GR00T-Mimic 使用 NVIDIA Omniverse 和 Cosmos 增强现有数据，而 GR00T-Dreams 则使用 Cosmos 生成全新数据。