人工智能帮助我们理解社交媒体
上图:社交媒体和人工智能(AI)图片来源:
Shutterstock.com/Lenka Horavova
如果你是X战警(X-Men)漫画系列的粉丝,你一定熟悉Cerepo。这款虚拟设备可以介入人类脑波,并通过个人思想和经历识别变种人。如果Cerepo真实存在,如果全世界都热衷读心术,可怕吗?
虽然人类还没有实现这种超能力(神经量子可以“纠缠”任何人?),但发布在社交媒体上的信息,揭示了大约二十亿人的生活状态,即全世界总人口的四分之一的个人信息可用于分析。我们所缺乏的是分析这些信息并让其发挥作用的有效方法。
很多应用中,软件已作为辅助工具,特别是用于表达个人意见。目前现有的工具可以在消费者和企业间快速建立会话和发布社交帖子。利用这些工具,通过开放、真实的会话,企业可以吸引更多用户,了解用户需求,并关注其动态。
然而,这中间仍有大量数据分析工作可做,尤其是数据聚合。社交网络和软件工具总结的意见大部分出自每个行业最具影响力的观点。我们不做分析。现有技术搜集大家观点,而不探究观点背后的原因。原因是很难理清“为什么”,因为背后的原因通常不是显而易见的,而是需要复杂的推理或大胆的假设才能找到。
我们虽然可以有效解析单词和短语趋势,但无法进行深层语句理解。仅获取当前热议话题远不能准确定位特定人群对所述话题的感受,以及他们观点背后的原因。对话以及展开对话的人是三维的,所传达的信息远不止单词本身。
最高效的算法和最优秀的实践者都没能找到会话人、话题以及因果关系之间的微妙联系。例如,针对最近美国总统选举,民意测验专家、学者和分析师都没有预测出谁将获胜,他们正忙着解释原因。答案可能隐藏于数十亿的社交帖子中吗?
如果我们可以借助人工智能来调查并得出结论呢?想象一下,身边有一款受命令驱动的人工智能产品。例如,数字研究助理每秒阅读理解成千上万的帖子,然后总结关键信息。
人工智能能胜任这项任务吗?目前还不能
目前人工智能系统可以抓取头条新闻,但当前人工智能系统应用范围窄,只能用于看起来辛苦的任务。Uber以及其他企业正致力于训练汽车对周围环境的感知能力,汽车自主决策拐弯或规避行人,但汽车永远不知道如何长翅膀飞翔。谷歌研发了一款人工智能机器人,它在一个高度复杂游戏中战胜了人类,但也无法回答该游戏相关的历史问题,也无法自主学会如何玩其他游戏。
今天,人工智能仍然是一个误称。《牛津英语词典》(谷歌)中,智能定义为“获取和应用知识和技能的能力”,而目前人工智能还达不到这样的标准。用MIT数字经济(Digital Economy)计划的研究员Tom Davenpor(该领域的思想领袖)的话来说,“深度学习不是深刻地学习。” 或者,引用另一位专家Oren Etzioni(Allen人工智能研究所(Allen Institute for AI)的CEO)的话,“人工智能,即在大规模(数据)上执行简单的数学运算。”目前的人工智能增强了计算机的能力,但还没达到人类所期望的人工智能的标准。
然而,将来,人工智能会达到这种标准吗?
幸运的是,人工智能研究正朝着“深度理解”的方向前进。历史上,人工智能主要利用图灵测试来评估机器仿人思考的能力。现在,给研究员提出了更高的要求,例如要求人工智能通过威诺格拉德模式挑战(Winograd Schema Challenge)。
威诺格拉德模式揭示了人工智能当前发展状态,也证明了我们距离真正的人工智能可能没有外行人看起来那么遥远。今年O’Reilly人工智能大会(O’Reilly AI Conference)上,其中一个例子如下。
大球直接撞在桌子上,因为它是泡沫塑料做的。
大球直接撞在桌子上,因为它是钢制的。
上面两句话中,“它”分别指什么?7岁小孩都知道答案。但对于机器,找到答案十分困难。所以,机器要从每篇微博中找到答案也相当困难。
当人工智能以近似人类的智能来学习和理解时,当人工智能能有效处理超越人类大脑极限的海量复杂数据时,人工智能就真的达到了通用的智力水平了。
像威诺格拉德模式这样的测试,可能推动人工智能对影响和联系的理解。然而,简单的基本语言理解只是通往成熟的人工智能道路上的一个早期站点,要达到自主获取信息并应用信息的程度,仍有很长的路要走。
我们的测试基准只比图灵测试略有提升,仍有很多工作要做。