强化学习

机器人学习技术,用于开发高效的自适应机器人应用。

Nissan

Image Credit: Agility, Apptronik, Fourier, Unitree

工作负载

机器人

行业

全行业

业务目标

创新

产品

NVIDIA AI Enterprise
NVIDIA Isaac GR00T
NVIDIA Isaac Lab
NVIDIA Isaac Sim
NVIDIA Omniverse

利用强化学习让实体机器人掌握复杂技能

随着机器人承担的任务日益复杂,传统编程显得力不从心。强化学习 (RL) 弥补了这一差距,通过让机器人在仿真环境中进行试错训练,从而提升其在控制、路线规划和操作方面的技能。奖励学习通过动态适应机制,使机器人能够发展出高级运动技能,完成现实世界中的如抓取、移动和复杂操作的自动化任务。

GPU 加速的机器人强化学习训练

传统的基于 CPU 的机器人强化学习训练通常需要数千个核心来执行复杂的任务,这增加了机器人应用的成本。NVIDIA 加速计算通过并行处理能力解决了这一挑战,显著加速了感知增强学习环境中的感官数据处理。这增强了机器人在动态环境中学习、适应和执行复杂任务的能力。

NVIDIA 加速计算平台 (包括 NVIDIA Isaac™ Lab 等机器人训练框架) 利用 GPU 的强大功能在强化学习工作流程中进行物理仿真和奖励计算。这样可以消除瓶颈并简化流程,促进从仿真到现实世界部署的更平稳过渡。

强化学习 Isaac Lab

Isaac Lab 是基于 NVIDIA Isaac Sim™ 构建的模块化框架,可简化强化和模仿学习等机器人训练工作流程。开发者可以利用新的 Omniverse™ 功能在启用感知的情况下训练复杂的策略。

  • 组装场景:第一步是在 Isaac Sim 或 Isaac Lab 中构建场景,并从 URDF 或 MJCF 导入机器人素材。应用物理模式进行仿真,并集成传感器进行基于感知的策略训练。
  • 定义强化学习任务:配置场景和机器人后,下一步是定义待完成的任务和奖励函数。环境 (例如。基于管理器的流程或直接工作流)确定智能体的当前状态,并观测和执行智能体提供的操作。然后,环境反馈下一个状态给智能体。
  • 训练:最后一步是定义训练和策略架构的超参数。Isaac Lab 提供四个基于 GPU 的强化学习训练库,支持模型训练:StableBaselines3RSL-RLRL-Games SKRL
  • 扩展:为了在多 GPU 和多节点系统中扩展训练,开发者可以使用 OSMO 在分布式基础设施上编排多节点训练任务。

NVIDIA Isaac GR00T 为开发者提供了一种开发人形机器人的新方法。这个用于通用机器人基础模型和数据管道的研究计划和开发平台可以帮助理解语言、模拟人类动作,并通过多模态学习快速掌握技能。

如需了解详情并访问 GR00T,申请加入 NVIDIA 人形机器人开发者计划

合作伙伴生态系统

看看我们的生态系统正在如何基于强化学习和 NVIDIA 技术开发自己的机器人应用和服务。

开始体验

当今的研究人员和开发者将强化学习广泛应用于机器人开发。进一步了解用于机器人学习的 NVIDIA Isaac Lab

新闻

相关用例