DeepMind推新算法教智能体从零学控制物体

程序员文章站 2022-07-08 12:55:18

DeepMind发表博客文章，提出一种称为SAC-X（计划辅助控制）的新学习范式，旨在解决让AI以最少的先验知识，从头开始学习复杂控制问题的挑战。这在真实环境中成功让机械臂从头开始学习拾放物体。SAC...

DeepMind发表博客文章，提出一种称为SAC-X（计划辅助控制）的新学习范式，旨在解决让AI以最少的先验知识，从头开始学习复杂控制问题的挑战。

这在真实环境中成功让机械臂从头开始学习拾放物体。SAC-X 是基于从头开始学习复杂的任务这种想法，即一个智能体首先应该学习并掌握一套基本技能。就像婴儿在爬行或走路前必须具有协调能力和平衡能力，为智能体提供与简单技能相对应的内在目标（具有辅助作用），这会增加它理解和执行更复杂任务的可能性。研究者认为，SAC-X是一种通用的强化学习方法，未来可以应用于机器人以外的更广泛领域。

上一篇：酒店B2B人工智能平台Trilyo融资25万美元，将扩大东南亚市场业务

下一篇：爆逗,言语犀利的二货男女