欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

工程师看AlphaGo首落败:为何出现低级错误?

程序员文章站 2022-04-04 17:53:14
文/出门问问CTO雷欣 出门问问NLP工程师李理3月13日消息,人机大战第四局出现大逆转,AlphaGo对形势作出错误判断后,接连出现业余选手也不会犯的低级错误,导致落败。DeepMind创始人Dem...

工程师看AlphaGo首落败:为何出现低级错误?

文/出门问问CTO雷欣 出门问问NLP工程师李理

3月13日消息,人机大战第四局出现大逆转,AlphaGo对形势作出错误判断后,接连出现业余选手也不会犯的低级错误,导致落败。

DeepMind创始人Demis在推特发微博表示,AlphaGo在第79子时犯了错误,但是一直到87子才发现。短短几个子的时间,AlphaGo的胜率从70%陡降至40%以下,发现时为时已晚。

出门问问CTO雷欣称,这其中的原因很可能是由于AlphaGo在复杂情况下的判断还是不够客观,碰到没见过的下法(如今天的白78挖)时会犯错误,而且在犯错误的时候不能够及时发现,会接连出低级错误。对人类来说,如果犯了大错误,应该很快就会发现并且纠正,但是机器的反应都是连续的,不能做出及时调整,这也许是AlphaGo的一个致命弱点。

出门问问NLP工程师李理称,我怀疑是mcts的问题,这个问题导致AlphaGo只区分胜利和失败,但是剩多少和负多少它不区分。李理称,这可能是AlphaGo之前获胜也不多,失败就乱下的原因。

从专业技术的角度看,李理认为,如果一定要猜测,我觉得可能是开局主要靠value network,因为搜索空间太大,有可能在某些特殊的局面下出现非常差的结果。就像之前神经网络识别图片时也出现过很诡异的错误,还有人研究怎么构造让它识别出错的例子。

雷欣称认为,从谷歌的角度来说,这盘棋帮助他们找到了AlphaGo的一个弱点,以后可以更有针对性的去解决这个问题。如果不是李世石这种顶尖棋手,也许很久也发现不了这个弱点,因为水平悬殊太大根本没有机会逼得AlphaGo犯错误。从李世石的角度来看,这也是一个巨大的胜利,证明至少目前人类选手对战人工智能还是有机会的。人工智能虽然计算能力强大,但是还是会犯错误,并且是很低级的错误。这样,人类棋手不会把人工智能神话,以后对战的时候心态会更好。

(本文由科技小羿整理,转载需注明出处)