谷歌的AI现在能踢“足球”了 它是如何做到的
谷歌的AI一直朝着超神的道路走去。自从在围棋上击败李世石之后,谷歌的DeepMind小组并没有停下,接下来他们要挑战的内容是3D导航和益智解谜游戏。
在DeepMind的挑战中,最值得注意的是一款名为“蚂蚁足球”的游戏。玩家需要控制一只蚂蚁形状的物体去追逐小球,然后带球直至将其送进球门得分。这种事对于人类来说可谓易如反掌,就看DeepMind怎么做了。
根据DeepMind小组David Silver说法,AI不仅完成了这个挑战,最令人惊讶的是它在整个过程中“完全不需要提前灌输有关力学的任何知识”。这个结果表明,谷歌提出的强化学习(Reinforcement Learning)概念近来又有了巨大的突破。
为了得到这样的结果,DeepMind结合了强化学习、神经网络深度学习和Deep Q-Network于一体。专门有一个算法负责存储机器人的经验积累,以及在完成某个特定行为后它的奖励预期。其实这也的算法早在DeepMind完成2D游戏挑战时就已经得以应用,不过Silver说它现在已经得到改进,比以前好得太多。
举个例子,该算法现在能够允许单个神经网络去学习多个游戏。为此研究组打造了一个大型分布式深度强化学习系统,能够利用谷歌的云平台来加速训练时间。值得注意的是,该技术已经被运用在谷歌的推荐系统中了。
不过,真正能够让DeepMind学会玩这个“蚂蚁足球”的关键在于谷歌最新开发出的所谓“异步Actor-Critic算法”,即A3C。在解决电机控制和使用视觉在随机3D迷宫中导航的问题上,采用这个算法的话标准多核CPU较之GPU效率更高。
David Silver 表示,DeepMind 现在达到的成绩可以说是最尖端的了,这样能够在训练时间和资源消耗上达到一个平衡。
随着AI 技术的继续发展,人类会受到威胁吗?事实上谷歌也有类似的担忧,DeepMind 小组曾表示他们担心AI 会自己发展出一套它们认为可以达到目的,但却不是人类想要的方案来完成目标。
为此,DeepMind 小组已经开发出了一种机制,据说可以无视AI 的任何行动直接使其失去作用。尽管并不清楚具体的原理,但我们似乎可以无需为此过分担心了。关于AI 会不会带来毁灭性后果的问题,业界中一直有着激烈的争论。不过对于我们每个人来说,这似乎还不是值得去认真忧虑的事情。
上一篇: 金屋藏娇的陈阿娇是什么结局?
下一篇: 基于车联网技术的汽车共享服务模式层出不穷