揭秘谷歌互联网语言系统的幕后英雄
(从左至右)Google工程总监钟胜华、Google工程经理杨帆、Google用户体验经理张英惠、Google产品经理林林、Google工程经理陈雍昇和Google中国的企业传播负责人Marsha。
文/白鑫
还记得早期在网络上可以看到中文的页面,一些比较难显示的字或冷僻的字,显示出来都是一个个小方块。这在行业内叫豆腐,现在已经几乎看不到类似的问题了。
但这个转变并不是自然发生的。因为在过去几十年里,有一批人默默的在背后,为了数码信息的全球化在做着基础建设工作。科技前往了Google北京办公室,听谷歌字体、输入法和emoji团队讲述这些工作平凡中的伟大。
谷歌字体的愿景: “消灭豆腐”
在互联网中,没有字体的支持很多文字无法显示,信息则无法传递,设计出支持所有文字的字体显得尤为重要。通常,系统不支持的字符会被显示为小方块,也就是乱码,又被戏称为豆腐。 Google工程经理陈雍昇介绍说:“Google开发的字体家族叫做Noto,意指不再会有无法识别的豆腐块(NO Tofu),希望让所有语言均能显示并可以有统一协调的观感。”
Google在字体方面投入了大量的努力,不仅综合各类语言资源,也遵循不同文字不同基线、字高等设计原则,尊重不同文字书写习惯,还为移动设备设计字体,为不同地区不同设备的用户提供更好的体验。
现在,Google的Noto字体已经支持超过100种文字、500种语言
,编写超过11万字符,并且免费赠予全球用户,可任意安装使用。Google产品经理萧湘晔透露,每天全球有上亿人次使用Google的Noto字体。 同时,Google字体也关注小语种,保护多样性文字生态,还研究彝文、藏文、蒙文等中国少数民族语言的字体,为数字世界延续中国语言文化。
输入法的魔力:让100余种语言在互联网上交汇融合
输入法的需求来源于键盘的限度,在没有软件的帮助下是无法输入中文或其他大型形意文字的语言。不同语言需要不同的输入法,因此Google为不同国家和地区的互联网用户提供语言输入的支持,通过对不同地区语言特性的考量为用户提供良好的体验的同时,让各种语言与文化在互联网上交流。
据Google产品经理林林介绍,现在Google输入法已经支持全球100多种语言,并在不断探索新的可能。从不同语言习惯出发,Google输入法为用户提供便捷精准的输入体验,比如Google输入法支持11种印度主要语言,覆盖约90%印度人口的母语。
Google工程经理杨帆表示,借助Google先进的机器学习技术,输入法团队便捷地解析语言模型,能够快速开发出新的输入法。此外结合其他服务,Google输入法还能为用户提供更多更好的体验,比如在iOS系统上的Gboard就能支持多种语言,并结合Google其他产品,为用户提供搜索、GIF搜索和发送等服务。
Emoji的背后:推动性别平等和多样化
Emoji已经成为大众常用的互联网表情,超过90%的在线人口使用Emoji。其中78%的女性经常使用Emoji,而男性则为60%。但在已有的Emoji表情中,代表女性职业和形象的表情却比较单一。
“为了推动性别平等,Google向全球Unicode技术委员会(Unicode Consortium)建议并推出了一系列新的职业Emoji图案,并在原本只有男性的职业和活动的Emoji加入了女性版本,推动性别平等,鼓励更多女性进行新的尝试。”Google用户体验经理张英惠表示。
据张英惠介绍,“Emoji最初的设计是为了在消息对话中,相较于传统的纯文字或者简单的表情,提供更丰富的感情色彩的表达。Google始终相信Emoji应该反映出我们的多样性,因此我们做出了很多的尝试和努力运用Emoji来支持性别平等和推动世界的的多样化。”
现在,字体、输入法、Emoji等语言类产品已经为全球用户带来了良好的体验,让人们可以便捷得在互联网上传、输入、沟通以及创作。Google工程总监钟胜华也指出,“Google希望搭建一套成熟的互联网语言系统,推动互联网世界的繁荣发展。从Unicode(万国码)到Google字体、输入法、Emoji表情以及翻译产品,Google一直在努力。‘整合全球信息,使人人都能访问并从中受益’,这是Google的使命,也是Google致力于提供语言类产品的初衷。”