师出同门:人脸识别与下围棋相比谁的难度更大？

程序员文章站 2022-03-14 08:53:18

近期人机大战又在不断上演，这次比较巧的是，谷歌的AlphaGo在网络上化身Master，碾压各路9段高手，最后以60胜的成绩战胜了所有人类对手，也创造了有史以来第一次，人类在棋艺领域被人工智能全面碾压...

近期人机大战又在不断上演，这次比较巧的是，谷歌的AlphaGo在网络上化身Master，碾压各路9段高手，最后以60胜的成绩战胜了所有人类对手，也创造了有史以来第一次，人类在棋艺领域被人工智能全面碾压的情况。

而另一方，近期江苏卫视播出的《最强大脑》节目，也开启了人机决战的比赛，而在第一期以人脸跨年龄识别挑战的节目中，百度大脑以3：2的优势战胜了人类，人工智能也再次战胜了人类。

而这两场战役也引发了网友们对于AlphaGo与百度大脑谁更厉害的讨论，更多的人倾向于下围棋的AlphaGo应该更胜一筹，因为下围棋似乎难度更大，但实际上并非如此，这里我们来做一些科普。

深度学习到底是什么

AlphaGo与百度大脑的技术，其实师出同门，都是采取了最前沿的基于神经网络的深度学习技术。

传统的计算机技术都是线性模型，即输入一个值之后，就会获得一个唯一的答案。但是深度学习则通过模拟人脑的方式，将数据网络进行“分层”，通过监督学习的方式，给机器各种数据，不断反复训练，最终让机器给出一个最大概率的答案，如果答案不够准确，那么机器就会通过监督反复学习。

而阿尔法狗下围棋与百度大脑的人脸识别，背后都采用了深度学习的方法。

阿尔法狗下围棋的原理

我们这里不讨论具体的技术细节，而是讨论技术本质原理。

下棋这件事一直都是机器的难题，因为把每颗棋子可能的落子考虑进去，以输赢为结束，那么所有落子的可能性总数加起来比宇宙原子数还要多。早期的机器受制于、存储根本无法胜任如此巨大的挑战，因此能够挑战国际象棋大师卡斯特罗已经是非常不错，而挑战围棋则是天方夜谭。

而随着这几年硬件设备的发展，计算机的存储、CPU、集群运算等能力急剧提升，当年打败卡斯特罗的只是一台小计算机，现在则变成了集群计算机，计算能力从只能单打独斗阶段上升到了，可以用成百上千台计算机群殴的阶段。

而另一个关键点则是深度学习技术，深度学习技术，可以反反复复的训练与模拟对决，而以胜负为终结标志，有了学习反馈，因此可以模拟出成千上万个棋局，再日以继夜的学习后，最终达成大师水平。

也就是说集群计算+深度学习，让计算机大幅度减少了暴力穷举的次数，调试人员只需要不断修改算法模型，就可以获得最佳结果。

百度大脑跨年龄识别的原理

此次百度大脑所挑战的跨年龄识别，同样运用的也是深度学习原理，但是也有区别。

即使下棋用了深度识别，但是本质依然是暴力计算，只不过深度学习模型让其大大减少了无用的暴力计算程度。而图像识别并简单的非暴力计算就可以达成，因为面对太多的不确定性，每一张图片中都充满了太多意外的问题，例如光照因素、侧脸、脸部眼镜口罩等遮挡物，等等都会影响到机器的结果。

因此，长期以来，机器在各种棋艺上对人类有着颇多挑战，但是从没有看过机器挑战人脸识别的案例，正是因为难度极高，即使有深度学习的助力，依然不能立即取的立竿见影的成果。

此外，此次比赛是跨年龄识别，这更又是一个世界*难题，对于下棋的深度训练来说，最终可以通过胜负给机器一个反馈结果，机器可以有效的进行反复训练，直到胜出为止。但是人脸的跨年龄识别就没有这么幸运了，这其中的数据实在太少，训练数据难以收集。没有足够多的数据，基于深度学习的神经网络很难学习到跨年龄的类内和类间变化。

正所谓巧妇难为无米之炊。

而此次百度大脑挑战跨年龄识别，则是在数据稀缺的情况下做出的挑战，其通过更改各种算法策略，以及深度训练模型，最终实现了一个非常好的结果。

人脸识别难于下围棋，但引起的感受效果不同

机器善于做的就是做重复性的逻辑性工作，而对于围棋这种黑白分明，完全依赖经验的事情，对于机器来说其实更为容易，因为并不需要面对不确定的环境。

而像人脸识别这种工作就不是如此了，机器不仅能够依赖的经验有限，更需要面对随时出现的不确定性，因此整个攻克难度依然巨大。

当然，归根到底上述所说的都只是方向上的问题，人工智能再人脸识别的这个研究方向整体上，难于下棋。因此，人脸识别要想取得一点点的进步，所需要花费的代价比下棋的代价大多了。

下棋是机器所擅长的领域恰恰又是代表着人类的智力巅峰，因此给我们所有人造成的震撼也就更大一些，而人脸识别则是机器的弱项，但又是我们每个人与生俱来的能力，并不能让人产生很大的震撼，因此甚至会有人认为下棋的难度大于人脸识别，这不过是站在人的立场上去考虑问题而已。

结语：

最后，我们需要公平的看待这两场比赛，AlphaGo与百度大脑，由于各自从属领域不同，因此不存在谁优谁劣的说法，只不过是从人的立场上去看，产生的主观感受不同而已。

事实上是这二者的表现，均体现了人工智能在不同领域的顶尖水平，都值得尊敬。

上一篇： Ubuntu16.04编译运行ORBSLAM3

下一篇：网页录音之麦克风权限问题