欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

抓住语音带来的创新机遇

程序员文章站 2022-03-15 11:43:41
      最近两年,不断有人问我同一个问题,移动互联网的创新方向是什么?   我每次的回答都是:围绕手机终端特性的功能创新。与PC不同,手机天生是有眼睛(...
      最近两年,不断有人问我同一个问题,移动互联网的创新方向是什么?

  我每次的回答都是:围绕手机终端特性的功能创新。与PC不同,手机天生是有眼睛(摄象头)、嘴巴(话筒)、耳朵(听筒)、有位置(LBS)等等,而其中要重点解决的一个问题就是输入。

  PC时代输入靠得是键盘和鼠标,它们让计算机的输入非常简单、直接。而手机上,使用全键盘和鼠标都是不现实,虽说触摸屏可以看做另一种形式的“鼠标”,但在手机上,输入体验一直并没有得到本质改善。

  所以早在2009年我们就判断,在触摸屏之后,“输入”还会有两次革命,而第一次就是语音。

  2011年10月,苹果发布了Siri,它通过语音大大简化了手机操作,使iPhone4S变身为一台智能机器人助手。我也在当月UC发布的《2011年第三季度移动互联网报告》中,再次强调了语音的重要。

  12月26日, UC浏览器语音公测版发布,我们终于把判断落实到了产品上,使UC浏览器成为全球首个使用语音智能控制的手机浏览器。

  不少朋友在此之前就已经通过网络获悉了这一消息,有些媒体还用“中国版的Siri”来描述UC。我们当然感谢大家对于创新的肯定,但“中国版的Siri”并不准确,目前UC浏览器只是实现了通过语音对浏览器的操作控制,如打开网页、控制浏览器功能操作、语音搜索等,但我们清楚,在语音控制和智能使用创新上,UC只是迈出了第一步,还有大量的工作和难题需要去突破。

  事实上,Siri发布之后,确实引起了一股语音风潮,很多开发者都跃跃欲试,市面上也出现了不少语音类的产品,但大部*限在“语音输入转换到文本”这个环节上,用户需要的只是文本转换吗?

  绝对不是!必须更进一步 。

  很多人都忽略了一点,Siri之所以让我们惊喜,并不是它因为用了语音,而是将语音与手机的各种应用完美结合。在语音这个问题上,开发者要避免两个认识上的误区:一、把大量精力花在语音采集技术上,二、只停留在语音输入转换给文本环节,裹足不前。

  语音识别并不是什么革命性技术,早在多年前,IBM 的语音识别软件在 PC 上就有不错的识别率,近年来,Google、微软包括国内的一些公司也投入了大量研发,形成了一些相当成熟产品。可以说,在语音识别环节,开发者想做出差异化已经非常难了,完全没必要自己动手,只要找到靠谱的技术提供商即可。这一点相信大家都能理解,造飞机的人不是每一个零件都要自己生产。

  另一点提醒是一定要走向用户需求识别和控制环节,与产品流程很好的耦合。当然这不是选择问题,而是能力问题,因为从语音转换成文本容易,理解“用户需求”和“做成动作”却是难点,它需要对海量手机用户习惯和需求的挖掘,以及学习算法。

  作为致力于移动互联网创新的公司,UC当然不会放过语音这个创新点。UC浏览器之所以能在全球首创使用语音控制的浏览器,背后是7年移动互联网产品技术积累、全球3亿用户的海量数据,以及自主研发手机浏览器内核的“核能力”。

  当然,如前所说,目前的语音产品只是UC交出的第一份作业,但UC会坚持在语音智能上发力,相信在中国以及手机浏览器这一领域,我们一定能抓住语音这一移动互联网创新机遇,提供更多浏览器人机交互创新,让中国用户更快享受到全球最先进的移动互联网产品。

  BTW:前文说到在触摸屏之后,“输入”还会有两次革命,第一次是语音,至于第二次是什么?卖个关子,大家可以想一想。