欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

人机对话声音“重女轻男”

程序员文章站 2022-03-15 12:21:18
  电话答录机、语音邮件、GPS电子导航仪、电子机器人……人们每天有太多机会接触机器的声音,甚至与人工智能交谈,机器发出的声音大多是一半人声、一半机器的合成,...

  电话答录机、语音邮件、GPS电子导航仪、电子机器人……人们每天有太多机会接触机器的声音,甚至与人工智能交谈,机器发出的声音大多是一半人声、一半机器的合成,也就是说,他们被设计之初就有了性别之分。电子导航仪通常是女声,银行系统的人机交互更多青睐男性的声音,如今大受追捧的苹果手机个人助理程序Siri在美国和其他大部分国家是很明显的女声,而在英国和法国则变成了男性。有趣的是,英国不少消费者提议,“希望他们的Siri能像绝大多数国家那样成为女性”,他们认为这样可以“提高交互的舒适度”。人们对机器的声音有着怎样的特别偏好?这种偏好又能给人机交互带来何种深远影响?


Siri为什么多是女声


  除了英国和法国,大多数国家的Siri选择的是女声,这个略微有些低沉,却又利落的一半女生、一半机器的声音,让人们不由自主地把Siri看作一个女性,甚至在与Siri的对话中出现了一些性挑逗问题,例如有人问Siri“你现在身上穿的什么?”Siri对此感到很困惑:“为什么人们老问我这个?”还有人问“你能跟我结婚吗?”Siri只能无奈地回答:“我的用户协议中不包括婚姻这一项,很抱歉……”
  绝大多数消费者希望自己的Siri是个女性,首要的原因在于生物学规律,科学研究已经表明,人们通常觉得女性的声音比男性声音更悦耳。“找到一个人人喜爱的女声比找到一个人人喜爱的男声要容易多了。”斯坦福大学教授克里弗得•纳斯指出,“人脑更喜欢女性的声音这是一个已然确立的事实。”纳斯还补充说:“研究表明,早在怀孕期间,胎儿就开始发展这种偏好。胎儿只对母亲的声音有反应,对其他女性的声音没有反应;对父亲的声音,胎儿并未做出特别不同的反应。”
  此外,从人类的性别特征和社会分工来看,女性往往更多地充当服务者的角色,这与一个可帮助安排行程、查找就近比萨店或告诉您是否将要下雨的虚拟“助理”的角色完全吻合。时间再向前推移,在二战中,女性的声音就已经被用于战斗机的导航设备,而当时的电话接线生大多是女性,可见,人们更习惯于从女性的声音中寻求帮助。


机器声音的发展


  其实最初Siri的语音应用程序并没有性别之分,也就是说,当时和人们对话的Siri程序没有任何的性别偏好。很快,人们便发现这种无性别语音系统无法满足人机互动的深层次要求。消费者不仅关心机器语音的对话能力,也关注其语言的温暖程度和友善程度。如今,当公司需要为其自动化机器配音时,它们更多会考虑一些专业的配音演员,收集他们的声音,并请来专业小组评价这些声音传达给听众的感受。
  在好莱坞早期的科幻电影中,人工智能的声音更倾向于男性声音,作为计算机的高级程序,男性的声音往往更具权威性和指挥力。“拍摄于上世纪70年代的影片《2001:太空漫游》中,Hal 900电脑就成功地发挥了男性声音的权威性。Hal特有的舒缓语气搭配男性语音,带给人一种不寒而栗的诡异感,将要塑造的反面形象表达得淋漓尽致。”《DVD导刊》影评人陆先生说。而这次机器男声的成功演绎带来的直接后果是,越来越多的高科技公司在其人工智能的语音选择上开始放弃使用男性声音,为的是让自己的人工智能听起来不那么邪恶。
  “鉴于人际沟通是女性擅长的领域,因此多数指令性机器或者服务类机器更倾向使用女声,这是女性的特长,也是市场的选择,并不存在性别歧视。”美国芝加哥大学性别和性研究中心负责人吕贝卡说。此外,对于服务于消费者的声音性别的选择,人们更多时候会考虑到实际情况,例如,旧金山地区的运输系统会采用更加高亢的女声,以便在嘈杂的车厢里能被清晰地听到。


声音性别*选择


  到底选择男声还是女声,研究专家认为,让人工智能拥有不同的声音才是语音合成的终极目标。也就是说,当人工智能懂得在不同的情境下选用不同的语音,根据不同的内容选择不同的声音,灵活运用各种说话的方式时,才会起到更好的人机交流的效果。
  不过要做到这点并非易事,人机交流不仅对语音合成技术提出了更高的要求,同时也涉及到计算机的语言生成,而要想让计算机理解人类的语言是非常困难的。要实现这种人机对话的灵活性和丰富性,让人工智能拥有人类的嘴,必须使其数据处理能力达到或接近人脑的容量和速度。
  幸运的是,位于马萨诸塞州的Nuance科技公司已经向着目标跨进了一大步,它创建了供用户自行选择的男声和女声系统,这样,“客户就能按自己的喜好来选择语音性别了。”公司首席创意克莱顿说。而这种可自行选择声音的技术将带来巨大的商机,“在车上,我可以选择一个类似我妻子声音的语音来阅读短信。”公司语音设计总监勃兰特说,“当然,当我想念孩子时候,这个声音最好还能*地切换成稚嫩的童声。”