欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

机器翻译会是人力翻译的终结者吗?

程序员文章站 2022-04-22 17:21:49
偶像剧《亲爱的翻译官》让翻译这个高冷行业也火了一把,可就当花痴少女们才下定决心默默啃单词时,机器翻译时代已悄悄来到我们身边。21日,一个由粤澳两地高校和科技公司联手组建的中葡英机器翻译实验室在广东外语...

机器翻译会是人力翻译的终结者吗?

偶像剧《亲爱的翻译官》让翻译这个高冷行业也火了一把,可就当花痴少女们才下定决心默默啃单词时,机器翻译时代已悄悄来到我们身边。21日,一个由粤澳两地高校和科技公司联手组建的中葡英机器翻译实验室在广东外语外贸大学签约成立,代表全球领先技术的人工智能工程师和语言学家们预测,机器翻译时代,以语言为基础的沟通方式、思维方式乃至社会关系都将发生翻天覆地的变化。

A澳门现状 人力翻译已不能满足需求

澳门理工学院院长李向玉是土生土长的北京人,毕业于北京外国语大学,精通葡萄牙语,因机缘巧合留在澳门工作了数十年。在他的专业眼光看来,澳门是因为多语言环境而导致效率降低的典型。“澳门的官方语言是中文和葡萄牙语,所有*部门的公文必须用两种语言准备两份,这使得*的工作量加大了很多,法务公文尤其突出,急需处理的文案堆积如山,为此也导致了民众的不满,认为*效率低下。”国际经济交流频繁的澳门,在商务领域,还需要大量中文、葡语和英语的相互转换工作,因此,基本只有精通中英葡三语的人才才能在澳门游刃有余,这给人才引进也制造了不低的门槛。

李向玉还有一个身份是全国政协委员,他以更全局的角度发现,像葡萄牙语这样的小语种导致的语言障碍在全国性的商贸活动中随处可见。“内地希望将澳门作为联系葡语国家的桥梁和纽带,现在我们和世界上8个葡语国家的商贸活动都很频繁,比如广东和巴西。降低语言障碍,仅靠人力翻译已经不能满足需求了。”

李向玉想到的办法就是大力推广机器翻译,以应对天量的语言交流需求。

半个月前,李向玉刚刚前往欧盟,目的正是考察机器翻译。他发现,在语言非常复杂的欧盟,早在十几年前就已经开始在公文系统中引入机器翻译。“由于公文语法规范,格式固定,变化不多,所以机器翻译效率非常高,只要随时将新词补充进词库。”李向玉看到,欧盟有一套检测系统,一份文件经过检测,可以准确判断出有多少内容可以完全由机器翻译。“一般只有10%左右的内容需要人力补充翻译。”李向玉非常赞叹。

由此,李向玉和同为全国政协委员的中国翻译协会常务副会长黄友义一拍即合,决定与毗邻港澳的广外和国内顶尖机器翻译科技公司合作,开展中葡机器翻译技术、跨语言大数据技术等方向的技术研究,并在澳门落地实施。

B科技创新 首次尝试计算机“神经网络”

一边是终身为翻译事业奋斗的语言学家,一边是机器翻译科技公司,两个似乎本应是对立面的阵营为何走到了一起?

答案是,他们要共同开发机器翻译的“神经网络”。

实际上,不仅欧盟,不少新闻媒体也已“尝鲜”,引入了机器翻译。比如央视国际频道的新闻播报,屏幕上的双语字幕其实就是机器翻译完成的,而BBC推出的新闻网页翻译也是由机器完成的,在新闻直播时,翻译字幕只有几秒的延迟。

但人们对机器翻译的期望并不只局限于公文和新闻,人们希望能第一时间看到最新的外语影片,只需在线字幕翻译而不用仰仗“字幕组”;留学生们希望可以走进世界任何一个课堂,通过即时课堂同声传译就能*学习,而不用再费时费力地先读语言预科。

“未来这些都可以实现。”合作方之一机器翻译科技公司的CEO于洋认为,目前的机器翻译在生动活泼不规范的生活语言领域之所以体验还不够好,是因为算法,只有让计算机能够像人一样思维,才能像人一样“说话”。

因此,中葡英机器翻译实验室会首次在机器翻译方面尝试使用“计算机神经网络算法”,而语言学家的加盟可以让这项技术得以完善。

什么是“神经网络”?机器翻译研究专家程国艮打了个比方:“比如人看到碗筷杯盘这类名词,即便不直接描述吃饭,也会联想到吃饭,这就是人的思维方式。而以往的计算机算法不是这样,没有这种联想,所以人们会觉得计算机与人交流时很笨。神经网络中,信息也将按照人的大脑完成记忆工作的方式来处理。”

C语音识别 早已成熟应用却被抱怨最多

很多人应该都有过被手机语音识别气得半死的经历,在机器翻译中,语音翻译可能是比文本翻译更加被普通人急需的功能,但就目前的应用现状看,“槽点”最多的也是它。但其实,语音识别没有我们以为的那么幼弱,在一些习以为常的地方,它们已经发挥了很重要的作用,比如中高考的英语“人机对话”。

广东省从1999年开始率先增加英语听力考试,并于2004年增加了口语计算机考试,也就是通常所说的“人机对话”——考生坐在电脑前,戴上特制的耳麦,计算机开始播放听力试题,考生根据提问一一作答。计算机记录下考生的答案后,综合打分。

“如此大规模的听说考试,如果用人与人面对面的考试方式,不可能像笔试一样数十万人同时考试,根本无法完成考试任务,所以广东采用了‘人机对话’,并在2014年开发了计算机评卷系统,非常高效。”广东省教育考试院副院长黄友文告诉记者,十几年的“人机对话”搞下来,高校反馈,广东学生的英语应用能力明显提高。

为什么关系到千万学子前途的国家考试敢于用这么“不成熟”的技术?专家解释,计算机语音识别在特定领域内的确可以比人更出色,即便是主观题的答案,得分点也都在一些关键词上,很容易被机器抓龋这时,既不会有日常语言中的千变万化,也不会有背景噪音和含混不清,机器识别反而更准确和高效。

D机器学习 大数据点燃人工智能加速引擎

如何让语音识别技术走下“规范用语”的窄轨,进入日常应用呢?除了前面说到的“神经网络”算法外,大数据时代的到来,将给语音识别乃至语音翻译插上翅膀。

“打个比方,人们常常在对话中会出现一时没听清楚的情况——你刚才说什么,请再说一遍?”程国艮给记者看了一段视频,这是一段极其简短的语言片段,说的是某种方言,在没有任何提示的情况下,反复听多次也不明白他在说什么。“这是因为人脑对语言的判断需要足够的信息元素,上下文语境等等背景可以用来帮助我们快速理解语言的意思,当抽离了很多信息元素时,就很费解了,”程国艮说,“但实验证明,在这种情况下,依托大数据的机器语言识别能力就超过了人脑,它能‘分析’出信息不够的语句背后的完整意思。”

专家们一致认为,翻译是人工智能中集大成者,随着大数据资源库的不断膨胀,机器能够学习的资源越来越多。“比如电脑手机的输入法,人们每敲击一次键盘,都是在给语言数据库以及其他各类大数据库添砖加瓦,机器就是这样学会了世界各地人们的各种语言习惯包括个性化表达。”于洋说。而要表达一个意思,熟练的翻译者可以掌握几种常用句式,但实际生活中,可能有超过100种句式,包括非常个人化的表达方式,这些就是翻译者无法掌握而计算机却可以全部学会的。

也就是说,不用担心未来的机器人说话干巴巴,它们能够说的花样可能你想破脑袋都想不出来。