高考机器人的难处究竟在哪里:简单问题复杂处理
前些日子,人工智能机器人AlphaGo赚足了大家的眼球,引发全民探讨人工智能的热潮。昨日消息称,2017年的文科高考生们即将迎来另一位人工智能竞争对手——高考机器人。由国家863超脑计划牵头研制的高考机器人将参加明年高考的语文、数学和文综三项科目的考试,它的目标是要超过重点本科分数线。
考数学
压轴题两分钟就搞定
记者昨日从成都一家科技公司了解到,高考机器人已被列入科技部863计划的首要任务,而该公司将主攻机器人在数学科目的考试。明年高考期间,高考机器人将单独在一个关闭外部网络的房间内,由专业公证人员监考,输入试卷电子版来读题,通过内部服务器的计算,最终由打印机打出其答案,与全国文科高考生同时考试、同时交卷。
数学组别的研发负责人、电子科技大学计算机学院博导符红光说,高考机器人其实是人工智能水平的试金石,技术关键在语言理解和知识推理。高考机器人需要通过推理建立知识库,而不是市面上常见的学习机储存的题库。“比如说,当解答鸡兔同笼的试题时,高考机器人不仅需要读题、理解,也需要掌握知识之外的常识,如鸡和兔分别有几条腿。”
在此前进行的测试中,高考机器人解答近几年的高考北京卷已能达到115分的成绩,最难的一道压轴题能在2分钟之内解出。2017年文科高考生不必担心的是,高考机器人的成绩并不进入全国高考分数排名。虽然如此,国家科技部立项时已明确目标,2017年高考机器人首次应考将力争一举考上一本。
根据超脑计划,我国的高考机器人计划在2020年考上北大、清华,而日本也提出在2020年,高考机器人考上东京大学。
写作文
反正看不出是机器写的
虽然我国首款高考机器人设定了考上重本的目标,但它从项目诞生到真正参考,仅有2年时间。在2年时间里,就需要完全具备一个18岁高考文科生的数学理解、逻辑思维和计算能力。
不仅仅是数学关,超脑计划的高考机器人项目,还包括另外两个独立的人工智能程序,分别主攻语文和文综。对比来看,数学是其中相对技术成熟的,语文和文综涉及到的主观题部分,对人工智能来说存在一定挑战,尤其是情绪、情感以及意识形态,对高考机器人都极有难度。
不少人好奇,数学的考试题目倒是有确定的答案,而语文的主观题尤其是作文,高考机器人怎么应对呢?对此,清华苏研院大数据中心主任林辉给出解答,其实现在国内外的机器人写作技术都日渐成熟,在美国硅谷就有一个“经济新闻的自我报道”项目,先给机器人几个信息关键词,它会按照经典的经济新闻模式进行整合报道,让人完全看不出来是机器人写的。
同样道理,由于语文作文的得分点中,立意新颖、有深度仅占几分,机器人读题后,分析关键词再进行写作,并不会影响文章的谋篇布局以及内容,仅仅是情感和情绪有所欠缺,不会导致大的扣分项。
技术揭秘
要拿高分 机器人的难处你不懂
机器人高考,难在哪?中科院自动化所模式识别国家重点实验室助理研究员汪昆,主攻机器翻译与自然语言处理。他分析说,机器人高考听起来轻松幽默,其实是一个复杂的科技命题。
简单问题要复杂处理
汪昆先描摹了机器人参加高考的情境:在读文字、听听力、识图的过程中,机器人首先要把人类的语言、图形映射为计算机能够处理的形式语言,再分析、理解和处理,最后以人类能够理解的方式呈现答案。
“这个过程会涉及语音识别、自然语言处理、自动问答和自然语言生成等诸多环节。”汪昆说。假如,我们给机器人出道题——姚明的身高是多少?对于这句话,机器人首先并不清楚哪几个字是一个词,它就要先做中文分词,然后进行具体命名实体识别,把这个句子里关键的人物、地点等信息识别出来,接着进行句法和语义分析,最终理解问题后,再在相应的知识库去搜索答案,然后以人类的方式给出回答。
机器人知识库的形成可以通过人工总结,也可以通过在互联网大数据库中自动挖掘。“相比之下,人工总结的方法成本较大,可靠性比较有保证。而网络数据量大、时效性强,但有时受网络资源本身的限制,有可能会产生一些误差甚至错误。”汪昆说。
推理让机器人头大
姚明身高的问题可能还相对简单,如果换成“姚明老婆的身高是多少”,机器人的大脑可就得多转几圈了。“因为这涉及知识推理。”汪昆解释说。机器人要把“姚明老婆”的表述准确转化为“叶莉”,再到有关叶莉的知识库里去搜寻答案。如果一个表达涉及多层的语义转化和推理,对机器人来说就比较难了。
目前,机器人高考的每一个技术层面都有需要进一步攻克的难点。比如,自然语言处理在中文分词和实体识别上的准确率是95%以上,而对于更难的句法和语义分析,仍有待提高。对于比较复杂的知识推理,机器人处理起来会觉得很头大。
汪昆介绍说,相比中文,英文更容易被机器人理解。一方面由于英文的相关技术研发起步早、发展快,另一方面因为英文本身语言上的特点,便于机器人进行判断。
考生影响
现在可以帮你学习 成绩越好作用越大
目前,相关技术在四川、江苏试点学校已达20所,包括前端的学生答题笔记采集设备,后台的智能测评机器人等,能精准采集学生书写的原始笔迹,自动识别,对学生答案正误、错误知识点、错误原因判定,将前后答题步骤进行逻辑推理证明,实现一题多解下的评测。另外,还能找出知识缺陷开展针对性补习,减轻教师批改试卷和作业的工作量。
不过,有趣的是,经过一段时间使用,学校统计发现,学生的成绩提升仍呈现一定规律,即班级里排名前20的同学进步最大,中游学生进步空间次之,排名末尾的同学仍然原地踏步。电子科技大学实验中学的一位老师说,这其实说明了学习成绩提升的关键还是学生自身的学习习惯、专注度和自我约束力,人工智能仅是辅助手段,比如他就收到了这样一张考卷,上面的答题框里有一句人工智能也无法分析的回答——“我要睡觉了”。(据新华社、经济日报、华西都市报等)