欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

OpenAI开源自驾开发环境 包含代码及预训练AI代理

程序员文章站 2022-04-02 17:33:31
由Craig Quite的DeepDrive项目搭建和维护的、加入了Grand Theft Auto V的Universe(OpenAI的人工智能训练平台)现在开源了。要使用这一平台,你将只需要购买一...

由Craig Quite的DeepDrive项目搭建和维护的、加入了Grand Theft Auto V的Universe(OpenAI的人工智能训练平台)现在开源了。

要使用这一平台,你将只需要购买一个复制版的GTA V,然后你的Universe代理将能够在一个高保真度的虚拟环境中开始加速汽车上路。

在Universe中,GTA V能让AI代理进入一个丰富的3D世界。下面这段视频展示了,喂给代理的帧(人工减速到8FP,左上),对代理的诊断以及环境(左下),以及人性化的*摄像头视角(右)。在GTA V中,用于纠偏的人类行为都是非暴力(non-violent)的。

OpenAI开源自驾开发环境 包含代码及预训练AI代理

本次开源发布的内容包括:

GTA V环境的源代码和AMI;

一个预训练的驱动代理,具有Caffe和TensorFlow实现。

集成以上两者能够支持选择摄像机和视场偏移,还包括通过强化学习训练实现奖赏功能,能够让代理学会避免碰撞,计算目的地距离和停留在路上。

现在,游戏能够在云中的Windows虚拟机上运行,并通过websockets和VNC与Universe通信。因此,Universe代理可以在Linux或Mac上运行,并且可以在任何ML框架中编写。

GTA V给研究人员提供了一个用于测试和开发AI丰 富多样的世界。GTA V的岛屿设置几乎相当于五分之一个洛杉矶,还可以访问各种场景来测试系统。除此之外,系统提供257种不同的汽车、7种类型的自行车和14种天气,在单个模拟器里使用这些数据进行排列组合,可以实现大量不同的虚拟场景。

至于这次发布版本中包括的基础代理,是通过模仿学习21小时(约60万图像)游戏画面进行驾驶训练的AI (内置的游戏AI是很好的初始目标:它的性能优于一个典型的人,因为它可以访问内部游戏状态,虽然AI仍然会犯错误,如在高速公路上进行U转弯)。基准代理可以驱动各种不同的天气条件,对交通作出反应并保持其车道。

OpenAI研究员表示,这个预训练代理只是一个开始,他们邀请全球开发人员一起改进这个代理。

GTA V与Universe的集成自动继承了Universe为了可比性和共享性而提供的所有工具和语义,能够很简单地对GTA V上的代理进行性能基准测试。Universe+GAT V可以单独使用,也可以作为使用Universe代理访问的一个环境。