优必选双足机器人明年推出 机器人将遍地跑?
编者按:依托深度学习,人工智能迎来了又一次的科技浪潮,AI也由此成为2016年科技最热词汇之一。聚焦今年热点,媒体智能推出「AI+」系列报道,关注人工智能领域从技术到投资、产品、应用等多链条发展,寻找AI与多行业结合的关键人物以及产生一系列化学反应。本文为系列报道第6期,「智能菌」采访了优必选CEO周剑、人工智能首席科学家陶大程、人形机器人首席科学家赵明国。三位高管从战略、技术、研发、市场等方向详细阐述了优必选的发展策略以及未来商业布局。
12月14日,人工智能和人形机器人研发公司优必选在北京举办了战略发布会。正式宣布悉尼大学教授陶大程加盟公司任人工智能首席科学家,清华大学赵明国教授担任公司人形机器人首席科学家。
主打人形服务机器人,将于亚马逊合推LYNX
会上,优必选CEO周剑对公司的产品进行了梳理。首先是Alpha机器人,目前已经推出第二代,具备语音聊天、办公助手、天气预报、常识传达、儿童陪伴、智能控制的功能,同时Alpha还具备开放系统。Alpha机器人曾经在今年2月的央视春晚上亮相,成为明星机器人。第二款产品是Jimu教育机器人,优必选在今年7月与苹果达成合作,Jimu Robot教育机器人登陆苹果全球零售店,主要用来编程教学。
除此之外,优必选还宣布与亚马逊达成合作,共同开发基于Alexa助手的LYNX机器人,周剑称未来LYNX将替代Echo为更多的用户服务。优必选还与曼城足球俱乐部等公司合作,未来将制作球星、影视大片的机器人衍生产品。另外,周剑还在会上透露,优必选明年将推出一款B端的商用机器人产品。
机器人将取代手机?未来的商业模式是什么
周剑称,人机交互发展的趋势是反馈延迟低、命令要去模糊化、输入内容便携话和多样化、输出内容多样化和真实化。未来的消费级智能终端演进趋势,应该是从PC到手机,再到机器人的形态。而现有的终端,只能获取用户零碎的画像,不能定义用户全部的画像,在商业服务变现的过程中也不准确。周剑认为,被动的交互未来都会被主动交互所取代。
那么,谁才能定义你的全部画像?周剑认为目前也许只有你的家人。而让人形服务机器人成为家庭一员的基础是取得家庭成员的信任,而未来的人形服务机器人将在运动控制和人工智能上将无限接近人。
周剑表示,优必选希望打造基于垂直服务场景的机器人商业闭环,机器人主动进行数据收集,然后上传到云数据平台,经过大数据分析,构建完整用户画像,再推动数据商业化。
机器人将步入快速发展期?优必选明年推双足机器人
据悉,优必选成立于2012年3月,当时的主要业务是做伺服舵机,先后接受了数家投资机构的投资。据周剑在会上介绍,优必选2013年获得比亚迪联合创始人夏佐全等人天使轮投资;2015年启明创投、科大讯飞先后投资优必选2000万美元;2016年获得鼎辉资本领头、中信证券、金石创投等跟投的B轮投资,估值达到10亿美元。周剑透露,优必选今年的销售额已经达到3亿元人民币,预计明年这一数字可以达到10-15亿元人民币。
在采访中,周剑为优必选制定出了未来三年详细的发展规划。在未来三年,优必选将成立X-Lab实验室;完成微型伺服舵机、大扭矩高爆发力伺服舵机的商业化研发;推出商业化面向市场的双足家庭服务机器人;并且在2019年要推出人形家庭服务机器人操作系统,预计销售额将达到51.4亿元。(小羿)
以下为周剑、陶大程、赵明国受访实录(经智能菌整理):
图:左 赵明国、中 周剑、右 陶大程
关于产品和研发
问:目前来看机器人的成本还是比较高的,包括研发成本等等。现在如果这个机器人要落地,一方面需要成本,一方面还需要市场的吸引力,优必选是如何实现的?
周剑:我们在驱动和运动的布局一直是优必选与生俱来的优势。在这个过程当中,科大讯飞成为了我们的股东,未来的语音可能更多的与其合作。但是就像陶大程老师讲的,人类70%、80%的日常信息是用到视觉的。所以我们在2015年年初就跟陶大程老师开始合作,视觉我们主要抓在自己的手上,驱动和运动也是一直在自己的手上。我们认为人工智能应该找到落地的东西,目前我们认为应该是机器人。其实我们把握的是一个本质。
市场吸引力方面,比如说我们做两条腿走路,假设推出了“钢铁侠”的机器人,如果你喜欢这个IP的话,你可能会乐于购买,因为IP衍生品销售量占的量比较大。这个本身就是一个吸引力。从另外STEAM的教育也是非常清晰,教育无论是从校内、还是校外,在全球都是非常大的市常我们讲某个品牌的积木,也是做教育的,但是在教育里面使用到真正机器人的技术,比如说伺服舵机、控制、以及各种传感,要么价格很贵,要么就很难真正的落地。这个是我们最本质的优势。
另外Echo已经证明了,在某些家庭里面,美国很多家庭主妇在家里负责厨房,听歌,买东西,叫Uber,叫披萨,这个在弱人工智能期待是必须要经历。但是,我更希望它是一个人形机器人,这是我们跟亚马逊的共识。
问:我想问陶大程教授,现在优必选对于研发的力度非常大,以后会不会在形式上会有一些更多的创新?
陶大程:我觉得未来优必选在这个方面肯定是会大量投入,因为我们知道研究过程是非常漫长的,首先第一个可能要先有很好的研究成果。通常很多东西都是在大学诞生的,谷歌实际上最早也是在斯坦福诞生的,最后转换成了产业的结构,最后对世界产生了影响。
我想对于机器人和AI来说更是如此,因为很多东西实际上你要让它立刻落地,走入家庭生活,影响我们的一些日常生活,我觉得是有很多困难的。所以,第一步实际上还是应该在基本学术上进行突破。
因为有公司的研究院,所以能够尽快的知道学界第一手的结果,尽快进行整合,有效的推动未来的产品。
问:伺服舵机是优必选的核心技术,这个核心技术的壁垒有多高?
周剑:伺服舵机核心的优势门槛。首先我觉得世界上所有的东西都没有一个完完整整绝对的门槛,我认为的技术优势,或者是技术门槛就是时间门槛。这个是确定无疑的。比如说我们中国人制造战斗机的时候,很多技术迟早能够做出来的,只是时间问题。在伺服舵机方面我们发现了奇怪的现象,有很多人做机器人,但是很多人都没有做驱动关节这块,他们是做的一个*或者怎么样。做驱动,做伺服舵机的人不见得做机器人。
有三类机器人,一类是给无人机、航模等提供舵机的,包括云台。第二是集成机器人,这个企业特别多。还有一种是迎难而上,自己先把核心部件攻克下来的,我觉得优必选是第三类机器人。所以说我认为我们是占了一个先机和优势,还有很多算法在里面。但是我们并不认为这是一个绝对绝对的门槛高到别人进不来的优势,这个是时间都可以做的。但是我们先产业化了。
我们可以看到各种所谓叫做机器人的产品,我们可以看到很多产品。中国的工业其实也是在集成,在细分领域,做垂直领域细分的内容。但是真正在又做市场,又在啃技术骨头结合在一起的企业也不多。这个是优必选较大的优势。
问:优必选主要的机器人是关于家庭类,或者教育类,其他方面的机器人是不是有拓展?
陶大程:实际上最终我们的目标是实现完成人形机器人,比如说我们短期目标是实现完成人形机器人,比如说我们一个短期的目标是实现ASIMO这样的机器人。长期目标可能要突破ASIMO这样的状态,可能不一定有真人的皮肤和肌肉,但是形态、行为方式跟人可以说是非常接近的,甚至是跟人一样的。所以,最终的形态是说,首先初期来说除了像Alpha机器人,我们还会针对一些特殊场景有一些考虑。最终目标实现达到完全的人形化。
问:想请教一下两位教授,我刚才注意到发布会上有一个细节,我们渴了想喝水,机器人跑到厨房里面把水拿过来,我感觉这里面会用到环境感知,自主识别,机器控制的技术,这个功能大概什么时候实现?我们的技术已经到了什么样的水平?对物体的识别和抓取大概范围能够做到多广,不限于水杯,比如说拿一个快递,这些都到了什么程度?
赵明国:您提到的两个功能现在都可以做得到,但是只能做到比较单一。第二,做到以后付出的成本是多少。基本上要考虑的因素是付出的代价和达到的功能,整个服务机器人除了语音对话和交流之外,最近三年一定会在手机上先落实,然后再到运用部分,所以我们提前布局这块工作。关于手机这部分,其实它要和手机的硬件控制本身,和视觉,和其他的触觉都整合在一起,但是最终不是一下子把所有问题都做才落地,最急切的功能要先做到,然后在个过程当中不断叠加,一个是成本问题,一个是真正痛点问题的把握。
基本功能达到了,我们就可以不断迭代,真正产生一个符合需求的产品。我觉得两到三年,我们抓取一定能到位,只不过这个时候抓的是矿泉水,但是还不能抓一个香蕉,或者熟透的香蕉,或者腐烂的香蕉都能够抓取,这个很难,可能要到很久,再过几年。
陶大程:我觉得是这样,我看到赵教授这么强的信心,三年里实现抓取的任务,我觉得赵教授实现的时候,视觉这块一定跟上。总的来说,现在人脸识别这个方向,对于家庭成员是没有太多问题的,可以做到。包括,家庭成员的亲戚、朋友,我觉得能够做到很有效的状态,包括速度,包括精度来说都可以基本达到人的这样一种程度,但是不仅仅是人脸识别,比如说你的父亲,兄弟姐妹,可能也许你还没有完全看他的脸,只是看到他身体的某一个部分,就知道他是谁。实际上对于从家庭成员认人不仅仅是全部的。
然后物体的检测、识别。这个东西总的来说,女孩子的化妆品一大堆瓶子,哪个是抹脸的,哪个是抹脖子的,机器人识别也不是不可能的。我可以识别清楚这个是干什么的,那个是干什么的。
我们在精细化分类这块,我们的技术也是可以实现的。包括物体的检测,从速度的角度来说,精度也说,还是跟世界好最好的结果没有本质的区别。有的时候他好,有的时候我们好,根据很多场景,很多任务,包括获取的数据源有很多关系。还有您刚才说的家里定位导航,视觉技术。这个里面的问题非常的复杂,包括图像的语义分割,我要知道这个场景相互到底是什么,我要知道这个像素在实际的三维场景当中对应的距离是多少。
还有,包括一些特征点的获取,稳定一些特征的提取方式,牵扯的领域。我们的目标也是让机器人未来像人一样实现正常的定位,我觉得这个路不算遥远,但是投资的量却需要非常大的支持。两条腿走路,我们要尽快投入到研发之中,使得我们的技术尽快的转换成有效的,可以落地的产品。
关于市场和营收
问:刚才您在发布会上提到明年的销售额预期大概是10亿到15亿元,如何在一年之内做到三到五倍的增长,您能说一下优必选现在的的收入来源是什么吗?硬件收入占比是多少?明年的预期是多少?
周剑:优必选一直在保持快速的增长。2014年是190万人民币,2015年达到了5000万,今年是3亿,近几年一直是五到六倍增长。明年1月,亚马逊和优必选会共同发布机器人,按照亚马逊和我们的预期都认为这是个很广阔的市常亚马逊当时Echo卖了几百万台,双方的合作是我们重要的收入增长和来源之一。
总体来讲,2017年我们的来源主要来源于四块,第一是刚才提到的与亚马逊合作的LYNX机器人,第二是来自于IP产品的来源,第三就是苹果JIMU STEAM机器人,第四是To B的Cruzr机器人,包括在银行、商超、海关、安防监控等领域也是可以预期的。当然还有我们推出的Alpha2,这四块到五块的增长,我觉得能够实现2017年收入的预期。
问:海外市场,您预计今年和明年海外的占比是什么样的?
周剑:海内、海外销售的比例,我目前从全球布局。北美会有4000家店、欧洲会有2000家店,国内有2000家店,北美大概占40%左右,欧洲和中国各占到20%-25%,其他市场是10%-15%。
问:优必选的伺服舵机有没有服务的收入?未来会不会开放给其他企业使用,优必选收取服务费?
周剑:伺服舵机作为人形机器人核心的零部件,目前主要是我们的产能完全满足公司现有机器人产品,不排除未来如果说全球机器人市场爆发,伺服舵机会销售给其他公司,或打包销售给其他公司。
关于AI与未来发展
问:人工智能和机器人在无缝重合,包括机器人控制这块,您觉得什么样的功能能够一步一步成熟,这些功能落地的顺序是怎么样的?
陶大程:我们可以看到现在Alpha1S,实际上机器控制部分就桌面型机器人而言已经是非常稳定了的。Alpha2实际上继承了Alpha1稳定的性能,根据伺服舵机能够完成一些更为复杂的动作。现在在Alpha2上还会装有一些传感器,这些传感器在人工智能方面,比如说认识家庭成员,跟家庭成员做一些简单的互动,完成一些功能。所以说,后面关键主要是应用于家庭场景,针对不同的场景逐步去实现人工智能,这个事情可能会发生的比我们想象的更快。所以我觉得大家可以期待未来一两年的产品,可以看到很多很有意思人工智能的元素在我们产品上。
赵明国:机器人运动这块一定要先有良好的平台,所以我觉得落地的顺序应该是齐头并进,既要把大型的伺服舵机实现,另外相应的系统,相应的软件也要同步发展。但是最开始一定要把伺服舵机落实下来,然后整体的运算是所有算法为基础,对于大型机器人是这样的。
周剑:我补充一下,就像人一样,人从小生下来首先要具备关节和运动的躯干,有了躯干也不一定会有很强的运动能力。回到赵老师的话,首先伺服舵机的落地商业化这是提供了一个好的平台。在这个平台上提供一个好的算法,同时AI在齐头并进。否则的话的,就像一个人长得特别瘦,他可能长大没有任何运动能力,或者只会走路,基本不会打篮球、游泳。但是,换句话说,如果一个人的躯干不行,你再怎么培养他的运动、控制能力也是不行的,这个是相辅相成的。
问:人工智能对于产业的颠覆到底在什么样一个点可以出现?比如说以车辆为例,到底是超过我们一般人,还是需要超过舒马赫这个级别的才可以是一个颠覆?
陶大程:我个人做深度学习已经很长时间了,很早年以前叫做神经网络,没有什么太多新的东西,可能就是卷积神经网络。就像刚才我提到了,几十年以前Kunihiko Fukishima(福岛邦彦)教授就已经提出了新知机模型。后来纽约大学的Yann LeCun教授推出了卷积神经网络。但是,当时由于计算等等一些问题没有得到太好的发展。
因为我们都知道神经网络最大的问题是什么呢?很容易陷入到局部积值上,在没有大量数据进行training的时候,这个网络效果可能不会太好。
比如说我们今天在座的记者,男记者都是短头发,女记者都是长头发,我出去不能说长头发都是女的,短头发都是男的。实际上深度学习是一个潮流,但是并不代表我们应该放弃原始的学习。我认为统计学习和深度学习未来必将有机的结合在一起,在不同的方面解决我们的需求,是我们对机器学习一个基本的看法。
除了机器学习的本身,实际上背后还有很多的数学理论,通过来说工程师做一件事情的时候可能不会想这个到底是怎么样,我马上把它做出来。数学家就会很着急告诉他,你先等等,我们首先第一步要证明这个解的存在性。工程师就觉得我们随便找一个实施就行。所以说在我们要想推动神经网络的发展,或者推动机器学习的发展,或者推动深入学习的发展。
实际上我们首先要有很多的基础理论,其次要借鉴不同学科的结果,实际上是借鉴我们对大脑的理解。我们对大脑的理解是非常粗浅的。深度学习实际上也可以说这个状态沿袭了层级结构。我们已经看到了突破性的成果,实际上有很多,人在学习的过程当中实际上从简单到复杂,比如说一个小朋友,5岁的小朋友一上来我说我们来讲讲什么是微积分。大多数的小朋友还是要从1+1等于2开始,直到高等代数,这是一个过程。所以说,实际上机器学习也是一个过程,我们在做试验,还有一些分析的时候发现,如果你是渐进性的推动会有一些好处。