那些青史留名的AI和AI学家
文·本报记者 高 博 综合报道
由于4∶1大胜人类围棋冠军,一个名叫“阿尔法狗”的AI(人工智能)红了。在阿尔法狗之前,它的许多前辈也曾红极一时,深蓝、尤金……每一次AI的进步都会同时引发一轮热潮,我们应该记住它们和它们的缔造者——
随着阿尔法狗(AlphaGo)战胜李世石,人工智能的发展又引起了全世界的兴趣。其实,人们自古就幻想着智慧的机器。中国古籍记载,周穆王去西边的昆仑山旅游,碰到一个工匠叫偃师的,能造出跟人一模一样的假人,能跳舞唱歌,还对周穆王的爱妃暗送秋波。惹得穆王大怒,要处死偃师。偃师急忙扯掉假人的头,原来里面是机器。
如今大家对人工智能的印象,跟周穆王差不多:有时几乎被它蒙骗,但下一个时刻它又现出原形。即使许多最聪明的头脑投入这项事业,人工智能的“奇点”仍未到来。
不能不说的图灵测试
1945年,技术史上划时代的天才,阿兰·图灵提出了所谓的“仿真系统”,他写了一份详细的文件,想制造一种没有固定的指令系统的计算机。它能模拟各种不同指令系统的计算机的函数。
这份文件公布于1972年,此时大家才知道:图灵在二战结束时就开启了后来被称为“人工智能”领域的研究,而且他已经开始注意人的神经网络和计算机器可能的联系。
1950年,图灵来到曼彻斯特大学任教,并负责曼大的自动计算机项目。就在1950年10月,他发表了另一篇题为《机器能思考吗?》 的论文,成为划时代之作。也正是这篇文章,为图灵赢得了“人工智能之父”的不朽名誉。
这篇论文里,图灵第一次提出了“机器思维”。他有条理地反驳机器不能思维的看法。他还把对机器智能的判断变成一个行为主义范畴的问题。
图灵给出了后来人工智能领域的金标准——一个人如果不是面对面地交流,而是隔着一道帷幕,和对方进行问答,而且在相当长时间内,无法根据这些问题判断对方是人还是计算机,那么就可以认为这个计算机具有同人相当的智力。这就是著名的“图灵测试”(Turing Testing)。图灵说,只要有30%的人类测试者在5分钟内无法分辨出被测试对象,就可以认为机器通过了图灵测试。
虽然计算机当时刚刚发明,还远达不到能跟人对话的程度,但图灵预言,20世纪末会有电脑通过“图灵测试”。他的预言在IBM的深蓝身上部分实现。不过,卡斯帕罗夫和深蓝是通过棋局切磋,而不是言语交流。能够跟人长时间无限制地交流而不被辨认出来的电脑,仍然未有,这一点上图灵太乐观了。
2014年6月12日,一个名为“尤金·古斯特曼”的聊天程序成功地在5分钟内蒙骗了30%的人类测试者,被认为通过了图灵测试。但也有人反驳说,这个聊天机器人自称只有13岁,并使用第二语言来回答问题,因此它模仿的不应该是图灵所想的那种正常智人。
群星辈出的短暂黄金期
1956年8月,在美国汉诺斯小镇的达特茅斯学院,约翰·麦卡锡、马文·闵斯基、克劳德·香农、艾伦·纽厄尔、赫伯特·西蒙等人发起了第一次用机器模拟人的智力的大讨论。这些名字后来在学界都是响当当的。
会议开了两个月,没有共识,但会议讨论的内容有了一个名字:人工智能。所以也有人把1956年看作是人工智能元年。之后,随着大批智者扑向这一新领域,人工智能像喷气式飞机一样骤然升空。
一开始,有人用计算机程序代替人类进行自动推理来证明了数学定理。在达特茅斯会议上,纽厄尔和西蒙展示了他们的程序:“逻辑理论家”可以独立证明出《数学原理》第二章的38条定理;1963年,它已证明该章的全部52条定理。
1958年,美籍华人王浩在IBM704计算机上,5分钟之内就证明了《数学原理》中有关命题演算部分的全部220条定理。IBM公司还研制出了平面几何的定理证明程序。
1976年,凯尼斯·阿佩尔和沃夫冈·哈肯等人利用人工和计算机混合的方式证明了一个著名的数学猜想:四色定理——“任意一张区域划分的地图,仅用四种颜色就可以染色该地图,使任意两个相邻的国家不会撞色;这个定理之前被经验肯定,但人们不知如何从公理上证明。两位研究者把这个定理化作几千种不同的特例,然后用计算机的穷举能力,一个一个证明了。但这种借助计算机蛮力的办法,至今被许多数学家认为不算是真正的证明。
机器学习也突飞猛进;达特茅斯会议上,阿瑟·萨缪尔公开了一个跳棋程序,它具有自学习函数,可以不断总结经验提高水平。1959年,该跳棋程序打败了设计者萨缪尔本人,3年后,它已经可以击败美国一个州的跳棋冠军。
1956年,奥利弗·萨尔夫瑞德研制出首个字符识别程序,开辟了模式识别这一新的领域。1957年,纽厄尔和西蒙等开始研究一种不依赖于具体领域的“通用问题求解器”。1963年,詹姆斯·斯拉格发表了符号积分程序SAINT,输入一个函数的表达式,该程序就能自动输出这个函数的积分表达式。过了4年后,他们研制出了升级版SIN,已可表现出专家水准。
挫折后转向机器学习
一开始人工智能就显现出光明前景,学者们没有理由不乐观。1958年,纽厄尔和西蒙自信地说,不出10年,计算机将会成为世界象棋冠军,证明重要的数学定理,谱出优美的音乐。照这样的速度发展下去,2000年人工智能就能超过人类。
可事实没那么简单。1965年,机器定理证明遇到瓶颈:计算机推了数十万步也无法证明两个连续函数之和仍是连续函数。萨缪尔的跳棋程序也无法进一步战胜世界冠军。
1960年代计算机技术爆发时,大家估计人工智能不超过十年就能实现。但后来人工智能技术的发展之难,让很多科学家放弃了这个领域。后来学界也将人工智能分为两种:难以实现的强人工智能和可以尝试的弱人工智能。
强人工智能是科幻电影里常见的那种,可以认为它就是人,可执行“通用任务”。弱人工智能则处理单一问题。我们迄今仍处于弱人工智能时代。
1970年代,爱德华·费根鲍姆的思路被学界接受:人工智能不光要研究解法,还得引入知识。专家系统就诞生了。它利用数字化的知识去推理,以模仿领域专家解决问题。第一个成功的专家系统DENDRAL1968年问世,可根据质谱仪的数据推知分子结构。
在1977年世界人工智能大会提出的“知识工程”的启发下,日本的第五代计算机计划、英国的阿尔维计划、欧洲的尤里卡计划和美国的星计划相机出台,人工智能都是这些计划的重要组成部分。
于是,在1980年代,机器学习成为了人工智能的焦点。而且学者也提出了让机器不靠人类灌输知识,而是模拟小孩子自己去学的方法。其中,有学者模拟大脑结构(神经网络)实现,也有学者模拟与环境互动的简单生物体。他们与传统的人工智能流派鼎足而立。
但是,直到1990年代,人工智能的研究仍未走出低潮,日本在机器人领域大量投资,但当时效益不明显。
IBM“三兄弟”唱主角
1988年,人工智能系统深思闯入国际象棋界。它是IBM研发的,每秒考虑70万步棋。1991年,深思II战平了澳大利亚国际象棋冠军。
1996年,深思的升级版深蓝挑战人类国际象棋世界冠军,如日中天的加里·卡斯帕罗夫,2∶4落败。一年后的5月11日,深蓝以3.5∶2.5的成绩战胜了卡斯帕罗夫。这两次比赛都引发了全球关注,最终让人工智能重新赢得世界的注意力。
2011年2月,在美国一个著名的电视问答节目《危险》中,IBM公司的沃森(Watson)系统战胜了人类选手,成为深蓝后另一个里程碑。这个节目是各种知识的问答,主持人给出一些线索,选手则要猜出主持人所讲的东西。自然语言理解对机器是很难的,因为涉及到语言的隐含意思,各种比喻和歧义。沃森能够搞明白人类的语言是一大进步。
IBM巨额投入在各种表演性质的人工智能上,树立了AI领袖的形象,也拉升了自己的股票。目前,沃森和同类系统已经被用在帮助律师处理案卷,或者帮助医生根据病例做初步诊断上。
随着Google在近十年大量投资人工智能,桂冠似乎正要从IBM头顶摘下。谷歌公司的工程总监是未来学家雷·库兹韦尔,他由于普及了奇点概念而名震业界。库兹韦尔认为:人工智能迟早要发展到一个转折点,由于所有信息被人工智能吸纳,它将生产出人类再也无法消化的海量信息从而超越人类。
从神经网络到阿尔法狗
前几天结束的阿尔法狗对抗李世石,最终电脑笑到了最后,为什么人工智能这么厉害?靠的是神经网络进行深度学习。
所谓神经网络研究,可追溯到1943年。当时,沃伦·麦卡洛克和沃尔特·匹兹提出了单个神经元的计算模型。1957年,弗兰克·罗森布拉特扩充了麦卡洛克-匹兹模型,在神经元上加入了学习算法,并称之为“感知机”。它根据模型的输出,与人们希望模型的输出之间的误差,调整权重来学习。
感知机根据输出效果的好坏来调整自己的神经网络,这跟人的大脑是相同的原理。神经网络学派给机器学习指出了一条路。1974年,杰夫·辛顿提出,用多个感知机连接成一个网络,它就能解决任何问题;配合以反向传播算法,就能训练神经网络。
“阿尔法围棋”复制了小孩子的学习过程,成功了就调高相关通路强度,失败了就调低,使神经网络在自我对弈百万盘(用不同风格)后调整到最优。
除了模拟大脑的“神经网络派”,还有模拟昆虫的“行为智能派”。他们从蚂蚁这样单个智力有限但群体表现优异的动物获得启发,让机器在与环境互动中获得知识。不久前,美国波士顿动力公司研发的“大狗”四足机器人,就是这个学派的产物。
在几代人工智能学者的带领下,我们已经拥有了苹果的Siri这样真实可感的人工智能。下一步惊人的成就会从哪里突破?很可能不在学院,而是商业公司,或许不在美国,而在中国、英国或日本。无论如何,离人工智能交一份满分答卷还早。
上一篇: 模拟年化收益可观 大数据
下一篇: 两会提案:建立国家人工智能综合试验区