在移动互联网上,图像识别Face++可以做什么?
“在互联网上,没人知道你是一条狗”。
这是1993年《*》杂志关于互联网匿名性的经典论述。
时光荏苒,二十年后,这已经是一个“看脸”的时代了。那只狗还能否蒙混过关?
教会计算机识别喵星人的Google Brain现在还识别不出来汪星人,不过,做图像识别的Face++已经可以明确的告诉机器,你不是一条狗了。
Face++ 是一家专注于图像识别和深度学习的技术公司,成立于 2012 年,当时获得了联想之星的天使融资;2013 年获得创新工场百万美元 A 轮投资;最近,他们刚刚完成 B 轮融资。借着这个机会,我也和Face++的创始人印奇和唐文斌聊了聊他们在做和要做的事情。
一个看脸的世界
平时总会开玩笑说,这是一个看脸、刷脸的时代。这个还真不是玩笑,要进Face++进入办公室, 刷脸开门就是必须的。摄像头捕捉你的面容,与系统里录入的面部照片比对,确定身份,开门。当然,实际的场景就是印奇、唐文斌欢乐地进了办公室,把我留在了玻璃门外。
刷脸这事听起来还挺酷,但其实已经用在了不少地方,比如手机相机拍照时的人脸检测、各种美颜应用里的自动面部美颜、搜索引擎里的相似图片搜索、奢侈品门店的VIP识别,只是因为太“隐形”很容易被忽视。
那人脸识别技术要如何名正言顺地从幕后走向前台?Face++想到了身份认证。可能当很多人还在琢磨怎么结合时,他们已经向金融领域下手了。这其中,关注度最高的自然就是与支付宝的合作了。
还记不记得开通支付宝钱包时,要上传身份证;注册淘宝卖家账号,更是要拿着本人拿着身份证拍照;每次付款时,就需要输入密码。说到底,这都是为了验证一件事,目前正在进行资金操作的是不是你本人。既然机器认不了,就只能靠人来操作,人工审核、人工确认。但这就一定安全么?怎么能保证不会有人偷偷拿了我的身份证去注册支付宝钱包呢?怎么能保证“女大十八变”后审核人员还能认出十年前的我呢?怎么能保证机器能知道我密码没有被盗呢?看,是不是不寒而栗了呢?
从下一个版本的支付宝开始,也许你就可以直接刷脸认证了,在身份认证时,增加摄像头拍照的环节,与*部系统里的图像比对,确定用户身份。也许再之后的某个版本,你就可以直接刷脸支付了。是不是有点科幻?但也许下一个愚人节,这就不是空想、不叫“空付”了。
相比于支付宝,银行系统对人脸识别的需求就要更强了。网上银行的出现,让用户免去了奔波之劳、排队之苦,但银行的最大动力肯定还在于减少人工成本。即使如此,还有不少业务用户还得必须去线下办理。为什么呢?就是因为现在机器还没办法识别出来你是不是一条狗,你要去营业厅刷下脸,保证账户安全。人脸识别技术就是要线下物理刷脸的过程数字化、移动化了。线下营业厅的运营成本逐年增长,人工成本居高不下,人脸识别技术在未来就是一剂良药。
人脸识别的理想很丰满,但金融安全的现实也许就要骨感很多了。金融系统强调安全性,还有待实践检验的人脸识别用于金融安全认证,合适么?Face++的CEO印奇告诉36氪,“现阶段Face++的技术应用在金融身份认证领域,其识别精度在万分之一误识率的情况下,通过率能做到92%。”
现阶段,支付宝也只是把人脸识别,与掌纹识别等,作为一项辅助安全措施。蚂蚁金服的背后是淘宝和支付宝的大数据的支持,经过多年的积累,已经可以识别用户的消费、支付习惯。据说,这些用户模型还准确地识别出来好几起犯罪案件。但银行系统显然还没有这些技术做支持。也许未来当蚂蚁金服开放这些数据给银行时,推动人脸识别用于金融安全也就容易好多了。
撇开金融领域的“高大上”客户,也许人脸认证在很多其他“接地气”的领域商用就没那么困难了。
可以用于安全认证的生物识别技术其实还有几种,比如声纹、指纹、掌纹、笔迹和键盘敲击。指纹识别已经有不少移动设备厂商在做了,但还只是局限于少数高端设备。笔迹、键盘敲击短时间内被用户从心理上接受估计也不太容易。声纹识别往往会受为年龄、身体状况的影响。随着手机摄像头的普及,人脸与掌纹识别的设备门槛就要低很多。中国人讲“眼见为实”,外国人说“Seeingisbelieving”,对于普通消费者来说,排除整容、双胞胎等因素,人脸认证的教育成本在短时间内很可能要低于掌纹认证。
开通淘宝店、微信公众账号时,需要手持身份证拍照;当绑定的手机号码无法使用时,需要上传身份证照片,重新登录帐号。这种用户使用不便的背后,是厂商还要花费大量人工成本审核。利用人脸识别作为辅助手段,这些审核也许就是历史了。未来机器的成本越来越低,人工但成本越来越高,对于厂商来说,何去何从,毫无疑问。
上面的总总场景,我表达的都是机器完成的人脸认证都是辅助认证手段,看起来总在表达机器认证还挺不靠谱。事实其实刚好相反,理论上,机器采用数据分析,要远比人靠谱多了。支付宝的支付专家方如老师之前跟我聊天时也说过类似的观点。
如果计算机视觉公司可以把精度、安全性做到足够好,能够提供真正适用于的安全认证方案,后续的商业模式以及普及肯定就不是问题。即使每次认证只收一分钱,估计也是一笔不小的营收。看到这里,你肯定和我一样关心,这家公司会不会是Face++了。
Face++已经在商用化上起跑,但技术都有保鲜期,技术的应用也都有窗口期。在未来,如果有人能搭建出更优的算法机制和模型,会不会颠覆这种领先优势呢?
在我们看来,类神经网络的机器学习算法很有可能是一条本质的人工智能的技术路线,我们还没有看到新的算法有可能弯道“超车”。但我们也在尝试用全新的“软件+硬件”的方法进一步提升我们人脸识别系统性能。
机器之眼
不要把鸡蛋放在一个篮子里,Face++也不愿意把商业化全部押在金融行业的人脸认证。技术出身的他们,还想到了另外一件还挺创客范儿的事,想做一个基于摄像头数据结构化的IFTTT平台。
这个概念听起来还挺绕口,其实理解起来就没那么复杂了。比如,我们常见的门禁系统,就可以设定成 “If 在公司门口识别到公司同事, then 打开公司门禁不用刷卡”;奢侈门店的vip识别,本质上就是“If 在商店门口识别到 VIP 顾客 ,then 销售经理应该给于个性化的体贴服务”。
IFTTT 本身就蕴含来无限的可能,只要可以抽象出条件、执行动作,调用Face++ 的技术,就可以自定义自己的智能监控和智能家居应用:If 公司门禁识别到所有的员工已离开办公室, then 关灯;If 门禁识别出员工当天第一次进入办公室, then 自动推送当然的工作计划到员工手机和邮箱;If 家门口的摄像头识别出我已到家, then 煮上完最爱的咖啡,电视机调到我最爱的频道……
如果再把上面的这些事情抽象化,Face++做的其实就是机器的眼睛,让机器分辨人与非人,识别我与非我。仅仅不再“脸盲”的眼睛,还算不上智能。 Face++还想让他们的机器认出非人部分的品类,从识别“人”扩展到识别“物”、“人和物”之间的关系,后续还会推出 Image++ 和 Video++ 平台,打造真正的“机器之眼”。
看到这里,估计大部分人都要打断我了。这确定能做到吗?我脑子里也是一堆一堆的问号。
传统的人脸识别采用图像处理和模式识别技术,利用脸部器官的形状、大孝位置以及它们之间的相对位置等特征,通过普通光学摄像头采集脸部图像,提取图像上眼、鼻、嘴的大孝位置以及它们之间的相对位置等特征数据,然后与预先保存的脸部特征值进行比对,根据比对的结果,实现对身份的识别。
现在 Face++利用模拟人脑的深度学习技术,让机器可以从海量数据中自动归纳出各类面部特征,如五官布局,皮肤纹理等信息,然后与预先保存的面部特征库进行比对,根据比对结果,实现身份识别。这其实还是以五官为基础的。那么这么多种非人的物体,如何一一抽象出它的特征呢?Google brain 项目学习了那么多年,也仅仅只是能识别出喵星人。
我们要做未来“机器之眼”,所以一定是要从单一识别“人”,到识别更多的内容。从深度学习的角度来说,“人脸”和“物体”在很多地方有相似之处。“人脸识别”关注的更多是细节识别,看两个脸到底有什么细节区别;而很多物体识别,关注的是两个不同类别东西有什么区别,“猫”和“狗”有什么区别。但从技术框架上来说还是很相似的。
技术与资本的角力
技术型创业公司往往会面临不少压力与风险,埋头做技术也许就会默默无闻,失去宣传推广、商业合作、获取融资的可能;高调做事也许就会因为暂时性的不足而备受指责,甚至失去商业合作的拓展机会。
前几天有人跟我讲过这样的一个观点:最近一段时间国内不少技术型创新公司纷纷主动寻求报道,也许是感受到了资金上的压力。在还没有形成技术投资氛围的国内,技术公司还很难得到资本的青睐与认可。估计每一个自我定位为“技术流”团队,都会感动身受。事实上,也许每一轮新的融资注入,技术团队都会面临转型甚至商用的压力。
上次报道完Face++融资的消息,也有童鞋从一个旁观者的角度提了这样一个观点:资本对国内技术公司的青睐也许无形中就会扼杀掉无限可能。资本逐利,早期融资看重接盘的可能。投资技术公司,风险大退出难,自然有顾虑。但也有不少投资机构看到有技术背景的项目就趋之若鹜,在大饼都没有画出来时就纷纷“慷慨解囊”,也许就会传达出一种错误的信号,过分助长技术人才的自信,迷失自我定位,而过早地在资本的压力下考虑技术商用,本身也许就是一种伤害。