人工智能研究 还需打破学科壁垒的"生殖隔离"
尽管现实中的人工智能研究遭遇过“寒冬”,曾被科学家打入冷宫,甚至一度“门前冷落车马稀”(详见《中国青年报》7月29日报道《人工智能是真热还是虚火》),但在人类的艺术想象中,追寻人工智能的脚步却从未停歇。
无论是《星际穿越》中那个能看懂周围世界、听懂人类语言的可爱智能机器人Tars,还是今年风靡全球的“大白”,以及电影《她》塑造的能听懂人说话并与人交流,甚至与人恋爱的人工智能操作系统“萨曼莎”,艺术家们发挥他们的想象力,展望未来的人工智能。
那么,现实中的人工智能研究究竟到了什么地步?中国又当如何应对?近期在北京举办的2015中国人工智能大会给出了一个说法。
新松机器人*研究院院长徐方的看法是:工业机器人已经走进现实,未来5~10年,智能型工业机器人便会大行其道,先是在汽车等行业应用,然后扩大其使用范围,再将来,机器人可以代替人在不适合人类的场合工作。
人工智能与机器人是另一个科技创新的风口
就在这次大会举办的前一周,第19届RoboCup机器人世界杯在中国开幕。一个智能机器人以准确的中英文翻译,震撼了这个国际上规模最大、水平最高、影响最广的机器人大赛。
科大讯飞的机器翻译技术被用在这个机器人身上。在科大讯飞高级副总裁胡郁看来,5年前,没有人敢真正地在大庭广众之下,演示语音识别,“那时的技术还远不成熟,一演示就出错”。
5年来,人工智能有了快速发展,迎来了学界所说的“春天”。胡郁认为这得益于一些基础性研究的突破。比如,Google第一个利用云计算、大数据以及近几年发展起来的深度神经网络组合方法,使用户迭代的方式有所突破。这个标志性的技术,给整个人工智能发展提供了一个重大思路。
人工智能大会上,一个问题出现在了讨论环节——人工智能与机器人在下一个5年或10年之内,是否会成为另一个科技创新的风口?不少与会专家给出了积极的态度,这其中就包括科大讯飞董事长刘庆峰。
不过,在刘庆峰看来,真正意义上的创新,关键在于掌握创新方向的主导权,如果掌握不了主导权,产业规模越大,将来的风险越大。
在他看来,源头核心技术突破是人工智能浪潮中的“大波浪”,而这样的“大波浪”,目前却鲜有中国企业去做。他以苹果手机为例,该手机上的不少关键应用,并不向中国企业开放。这就意味着:如果中国企业只做“手机上面的应用创新”,未来整个产业的价值和主导权还是由别人控制。
换言之,在今天的移动互联网时代,3G、4G的通信技术、芯片技术以及安卓ios是引领潮流的创新“大波浪”,相应的,在这些平台上做的App就是“跟着走”的“小波浪”。“现在我们谈互联网思维当然很对,谈快速应用创新到风口也对,但那些都是小波浪,一个产业如果都这样相对急功近利,整个中国产业可能失去未来。”刘庆峰说。
他并不是唯一的思考者。在为期两天的大会上,不少人工智能领域的专家有一个共同的感受:如果研究人工智能的浪潮没有把对脉,就很可能是逆流而行。
视觉、听觉和触觉是未来的“大波浪”
在徐方看来,视觉、听觉和触觉将是人工智能研究的重点。正如中国工程院院士、中国人工智能学会理事长李德毅在大会上所说的,脑认知的主要外在表现是语言认知和图像认知。这同时说明,要赋予机器感知,就应当让计算机具有视觉、听觉和说话等能力,进而才能使机器具有适应环境和自主作出决策的能力。换句话说,让计算机学会如何像人一样听说看,才是计算机视觉和听觉研究领域的任务。
然而,这种对于人类而言与生俱来再自然不过的能力,对计算机来说却难上加难。如果说,人工智能发展到当今的成果是:计算机无论在计算能力还是记忆能力上,都能轻而易举秒杀人类中像爱因斯坦这样的高智商个体,但是在眼睛看和耳朵听的能力上,最厉害的计算机可能也比不上小婴儿或者邻居家的二*。
胡郁也提到《从0到1》这本书中一句经典的表述,美国近些年投入很多资金研发能飞的汽车,最后却得到了140字符(指的是Twitter):真实世界需要的是物理、综合的东西,但虚拟化和信息化反而发展更快。他认为这句话同样适用于人工智能与机器人。
在视觉方面,微软全球执行副总裁沈向洋持积极态度:人类的感知有九成之多来自视觉,研发这部分“将大有可为”。
比如,今年微软在社交网络上意外走红的“how-old”——用户可以通过上传自己的照片,来测试自己的年龄——就是利用脸部API,基于云的脸部识别算法来检测和识别图片中的人脸。
他还提到了微软小冰的最新研究成果,智能聊天机器人“小冰”具有辨识猫狗品种的能力,甚至在面对猫的图片时能够发出“小眼神儿太犀利了”的“吐槽”。而在“小冰”的开发过程中,深层神经网络为计算机提供了不少的帮助。
沈向洋也承认,发展计算机视觉是有难度的。比如在人脸识别过程中,由于拍照光线、发型、角度、妆容等因素影响,得出的结果往往大相径庭,照片上的林志颖和郭德纲现实中基本同岁,计算机却给出一个36岁、一个51岁的错误答案。正因为“A picture is worth a thousand words(一图胜千言)”,计算机在图像识别的路上还有很长的距离要走。
这在沈向洋看来,似乎更具有“目标”的含义,“对于在做计算机的人来说,如果把通过图灵测试做目标,目标就不够远大。”对计算机视觉,他预测接下来的研究方向是“两大一精”,即大数据、大计算、精准计算。这些也值得中国人工智能领域的专家所注意。
期待脑科学和人工智能研究的“杂交优势”
在听觉方面,刘庆峰也给出了他的预测:“我认为下一个产业趋势是万物互联,在这个过程中,绝大部分设备将没有屏幕,人在移动状态下不方便去看去操作。那样,语音时代就真正到来了。”
中国在这方面已经取得了不俗的成绩:语音合成、语音识别和自然语言理解领域都曾连续多次斩获国际大奖。刘庆峰说,科大讯飞从2006年起至今参加英文合成国际评测,取得了八连冠。甚至在2014年该比赛更改了比赛方式,改比印度式英语,中国依旧取得了第一。
据他透露,人工智能的语音发展,已经不仅仅意味着地图导航软件中能够合成林志玲的声音,它还可以用在教育领域的口语测评、主观题自动扫描评分,乃至在医疗领域根据语音自主判断病症等,“这些运用的前景不只是一个目标,更是件非常靠谱的事”。
不过,要真正打通“智能”这道关卡,在李德毅看来,还需打破学科壁垒的生殖隔离。
他说,悠久强大的学科,如生命科学和物理学,一定都是很有个性的学科,学科壁垒森严,存在“生殖隔离”现象,长期以来脑科学研究和人工智能研究犹如两条平行线,没有实质性的交集就是一个佐证。
也因此,李德毅将目光放在了认知神经学和认知物理学的融合,企图寻找“场外求助”——也就是一种组合的力量。“一旦碳基生物脑和硅基电子脑形成‘杂交优势’,其势将会猛不可挡。”
他认为,用人工智能技术构建千千万万特定机器认知脑,并通过移动互联网、云计算和大数据,或许就可以“倒逼并逼近一个人造生物脑”。
上一篇: 我备注一下
下一篇: 沃森想通过社交网络筛出最想要优惠券的人