欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

依图科技朱珑和他的人工智能创业经

程序员文章站 2023-08-18 15:26:22
前段时间做“关注人工智能系列报道”,有人推荐我采访依图科技的创始人兼CEO朱珑,他的简历很让我感兴趣。一是他的教育背景。加州大学洛杉矶分校统计学博士,师从Alan Yuille...

依图科技朱珑和他的人工智能创业经

前段时间做“关注人工智能系列报道”,有人推荐我采访依图科技的创始人兼CEO朱珑,他的简历很让我感兴趣。一是他的教育背景。加州大学洛杉矶分校统计学博士,师从Alan Yuille教授(艾伦`尤尔,计算机视觉学界奠基人之一,也是霍金教授的得意门生)从事计算机视觉的统计建模和计算的研究,之后在麻省理工学院人工智能实验室担任博士后研究员,2011年获得国际计算机视觉算法竞赛“图像目标检测”项目冠军。无论是师从的导师还是所在的实验室,都在AI领域赫赫有名。

二是他在做AI(人工智能)创业,而且是在2012年AI还没有热的时候就开始创业。所以关于全球AI的发展、关于AI创业,我想朱珑应该有很多值得关注的信息。

因为朱珑在上海,所以第一次约的是电话采访,但效果不理想。在朱珑出差北京的时候,又有了一次面对面的交流采访。采访前30分钟交流的是AI(人工智能)业界话题,朱珑给出的核心信息是这一轮的AI热潮是“深度学习”(deeplearning)带来的,其他的AI方法、技术、流派通通过时,甚至包括现在已经取得很多商业成功的IBM的Watson体系,也没入他的“法眼”。

这与上次对他电话采访时观点一致,我并不完全认同朱珑的观点,目前通用的AI技术没有出现,任何流派都有它善于的领域,考量它得看解决问题的成本和效率。基于此,我想关于业界话题和AI流派之争继续交流下去,恐无其他答案。

于是决定停止AI业界的话题,把采访转向朱珑的创业,因为任何观点最好的证明是要看它解决问题的效果。依图科技刚刚拿了几千万美元的B轮融资,从天使轮的真格基金,A轮的红杉资本、高榕资本,到B轮云峰基金等,也都不是钱多了没事随便乱花的主,投资人不会仅仅看朱珑的教育背景而一投再投,朱珑和依图身上有什么可以复制的AI创业经?

市场的“痛点”在哪?*局长给三分钟时间

朱珑首先进入*领域既有必然性也有偶然性。对于创业者,如何把一个看似稍纵即逝,只在眼前闪了一下的偶然性变成必然性,紧紧抓住是关键。

2012年的时候,AI没有现在热。尽管在2010年,IBM的AI系统Watson已经在美国电视《边缘游戏》节目中战胜人类赢得冠军,但还没有像今年谷歌AlphaGo与李世石下棋那样,引来全民关注。在美国Yann lecun(FaceBook人工智能实验室主任)实验室做研究的朱珑还是闻到了“AI要来”的气息。

尽管当时很多同学毕业去了华尔街,朱珑也可以在博士毕业后去做教授,但朱珑还是决定回国,并找到了当时在阿里云平台做技术负责人的同学林晨曦,准备一起创业。因为朱珑觉得做了这么多年的机器视觉研究,要想创造价值还得放到具体的业务应用场景中、以解决实际问题来创造价值。通常把理想变成现实最好的路径就做公司,用产品化的方式解决问题。

问朱珑为什么觉得2012年的时候机器视觉的工业化应用已具备条件,他没按常理给出“数据积累、需求、算法技术成熟”等等的逻辑答案,只是说虽然当时深度学习还没有被产业界广泛采用,但是有一种感觉就是它离产业化非常近、非常近了。“就是那样一种感觉。”

通常“学院派”出身的人更喜欢分享产业话题。但是两次接触下来感觉朱珑则刚好相反,很多事情在他看来就是“一种感觉”,如果大家在一个层级里,你能够懂得这感觉,但如果不在一个层级里,说再多似乎对方也不会懂。“要想有大师一样的视觉,得有大师一样的积累。”而在现实的世界里回答问题,得要拿实际解决问题的效果说话。朱珑说他和中国行业客户打交道,“如果你拿不出特别好解决问题的效果来,他们特别瞧不起你。”

目前看,现在AI创业的机会在2B的行业市场,因为有需求、有购买力。而从机器视觉的创业机会来看,市场机会在行业监控市场,这个市场有巨大的刚需,无论是金融、保险还是城市管理或是安防等都有旺盛需求和很多痛点。在几个可选的行业中,应该说朱珑首先进入*领域既有必然性也有偶然性。从必然性来看,*刑侦破案需要大量的视频、图像的比对需求,尤其需要从海量视频监控数据中精准、快速找到要找的犯罪目标,目前国内在这个维度与国外技术相比还是相对落后的。从偶然性来看,这与苏州市*局副局长所给出的“三分钟”见面机会密切相关。对于创业者,如何把一个看似稍纵即逝,只在眼前闪了一下的偶然性变成必然性,紧紧抓住,是关键。

依图科技朱珑和他的人工智能创业经

在各种市场机会的切入中,朱珑透过各个渠道找到了苏州*局主管技术的副局长。副局长只在课间休息给了朱珑三分钟见面机会。看着朱珑的一大堆“学术”背景,全球三大AI实验室的博士,图像目标测试的冠军,局长说:“好呀,我们现在套牌车的识别率不到30%,如果你能将识别率提升到70%,我就考虑用你们的。”因为很多名牌大学都没把这个课题做下来,局长只认效果。学术背景只能“敲敲门”,能否进来还得看你的“砖”够不够“硬”,副局长给了朱珑几个星期的时间。

找到“魔鬼”和捅开“窗户纸”

如何捅破问题的“窗户纸”?怎么优化、取舍、结合?怎么把“魔鬼”找到?需要物理学家精准描述世界的气质和找到“魔鬼”细节的感觉。

接下苏州*局长话的活儿,朱珑和林晨曦他们做了几个维度的事情。一是研究实际应用场景,找到解决问题的关键维度。其二把图像识别理论和产业难题和业务结合,变成这个应用场景的算法模型。“AI不是产品,它需要和具体的应用场景结合,解决具体问题。”一个算法模型并不适合所有的应用场景。这两个维度都非常关键。

就像网吧监控和道路行车监控需要捕捉的关键点就不一样,车牌识别之所以识别率不高,事实上选择识别的维度同样是关键。在过去对车牌的识别焦点主要车牌上,光线、车速,都会影响它的识别效果,而且还有很多套牌车,随时换牌。

朱珑他们想到如果能够将“车牌”与“车脸”同时识别,其识别率精准率就大大提高。因为很多套牌车常常会更换车牌,但是“车脸”和“车型”却不能更换,主流车型就那么几十种,“车脸”就那么几十种种,依图是第一个想到把这两个维度结合在一起的。就像人对一个车第一眼的识别和记忆一定是“车脸、颜色、车牌”同时摄入而不只是去盯着车牌的道理一样。

似乎想到“车脸”这事不是难事,但很多事情就这么一层“窗户纸”,当所有的人都把注意力集中在车牌这个“死胡同”出不来的时候,谁能够跳出想到其他关键维度,这个灵感就是那种说不清楚的“感觉”。这个感觉应该来自两个维度,除了朱珑在各AI名师下“耳语目染”的积累,同时也应该与他们每天见5拨警察,和他们几乎是泡在一起,体会他们的现实场景和工作场景的“悟道”有关。

依图科技朱珑和他的人工智能创业经

我搜索依图科技的公众号,看过一段朱珑与上海交大学生做讲座的视频,有几个印象很深的信息。一是朱珑说Alan Yuille给了他物理学家精准描述这个世界的“气质”。

他谈及了他的导师Alan Yuille教授,这个霍金的学生,物理学博士毕业,既在UCLA统计系任职,同时又在心理学系、计算机系、精神病学、生物行为学系任客座教授,研究过量子引力、机器视觉、生物视觉、神经建模、认知模型等。朱珑说:“这个导师给了我不一样的物理学家精准描述这个世界的气质,一种不一样的颗粒度。”

很多人应该会觉得朱珑认为导师给了他“物理学家描述这个世界的气质”,这个说法比较有趣,通常很少有人说导师给了自己一个气质。不过应该说朱珑的表述是精准的,百度里关于气质的定义是就是“表现在心理活动的强度、速度、灵活性与指向性等方面的一种稳定的心理特征。”对事物感受的强度、速度、灵活性和指向性不一样,才能做出和别人不一样的东西,这确实是朱珑老挂在嘴边的“那种感觉”。

二是“idea is cheap”,魔鬼藏于细节之处。”朱珑说,不管是在学术界还是行业领域,在全球*的学府、实验室和企业中,每个创新的idea都是聪明人都会想到的,而在英雄所见略同之后,决定成功的关键在于执行的每个细节中,这是由数学、物理、工程等基本功体现出来的。

几个星期之后,朱珑何团队是如期做到了超过局长希望的识别率,超过了预期,也敲开了*领域的门。除了车,后来依图又做了人脸的识别,有一个数据,依图人脸识别系统在武汉*局的实现证件照首位命中率是97%,盘查照对比首位命中率是94%,识别对比命中率是全球领先水平。四年时间,目前依图的产品进入了*、银行、保险、海关、电信、地产等,从识别车、识别图、识别人脸,从抓嫌犯到保平安到城市管理以及智能硬件。

为什么朱珑能够把识别率做到更好,仔细体会朱珑讲过的这些话,里面有“秘籍”。现在有很多行业的痛点,如何捅破这些“窗户纸”?怎么优化、如何取舍,怎么结合,怎么把“魔鬼”找到?这其中的“玄机”或许从朱珑的话里你会有启示。

IBM在对未来技术创新趋势分析中这样认为:未来新一代信息技术比较大的创新机会,一是在IT基础学科领域,二是在IT与行业结合点上。正是这个IT与行业的结合点,是难点也有大量的机会。比如要做输变电的创新,IT人就必须爬到电线杆上去。朱珑和他的团队就得“泡”在*的各种场景里。只有这样才可能找到“藏在细节里的魔鬼”。

记者曾经采访IBM研究院Watson项目的研究院员,IBM一开始做Watson的时候,把业界最好各个细分领域的技术成果放入系统中,机器人回答问题的精准率并没有提高多少,却是通过不同方式的配比和调优和取舍,最后准确率不断提升到99%。

朱珑的下一个“尴尬”

进入医疗领域有几个难题,一是怎么解决医疗资源、数据源的问题,怎么把医疗经验和计算机结合?二是怎么让医生建立对机器判断的信任问题?

朱珑没有透露目前依图的销售收入。从依图官方介绍信息上看,依图目前员工是100多人,人均估值超千万美元,按照这个数字推算,依图的目前的估值超过10亿美元。目前依图还在招兵买马中。下一个领域朱珑最想做的是什么?

朱珑说了一件“自己像*一样”的尴尬事。去医院看病,费了很多时间取号排队,见了医生,只是几分钟就把他给打发了,开了几盒药。“什么病?什么原因?怎么得出的结论?为什么开这些药?这些药和其他同类的药有什么区别?疗效怎么样?对于我适用吗?”所有的问题全部没有答案,就领了一堆药回去了。“一个*的IA科学家在医疗领域看病的时候完全就是一个*。”

“我得解决人在生命面前变成医学‘文盲’的这个脆弱”。朱珑决定进入医疗领域,从识别医疗图像入手,怎么就知道这个片子上有病灶?怎么就知道它是不是癌症?朱珑给学生做讲座的时候说过一句话,人眼不容易分辨出双胞胎的细微差异,但是计算机很容易就分辨出来,机器可以看到人眼看不到的东西。AI应该帮助医生提高诊断质量和盖上患者就诊体验,朱珑接下来想重点做这个事情。

进入医疗领域有几个难题,一是怎么解决医疗资源、数据源的问题,怎么把医疗经验和计算机结合?二是怎么让医生建立对机器判断的信任问题?记者曾经采访过英特尔中国研究院院长宋继强谈及IBMWatson在医疗领域的推进,宋继强认为,目前Watson最大的成果是已经建立起医疗机构、医生对Watson的一定的接受度和信任度。

大公司有大公司的玩法,创业公司有创业公司的路数。朱珑曾经说,目前各大公司在AI上的水平怎么样其实他清楚,因为在这些公司的做AI核心人是他的同学或做研究的前同事,这个人在做什么,水平如何,能做到什么程度,彼此清楚。

所以在不在核心圈子,是不是关键人很重要,对于进入一个新的领域也应该同理,都要找到对的核心人。就像当初朱珑找林晨曦,除了他俩是同学对路子外,林晨曦做云计算,有大规模分布式计算的能力,和朱珑的机器视觉能力互补,计算能力和AI能力是图像识别都需要的两方面。接下来朱珑会找一个有医疗核心资源的人。

“一个人是不是我想找的人,是一种感觉,交谈10分钟能够知道。”朱珑说有了第一步才有可能有第二步,只有解决了第一个问题,把东西做出来,效果显现出来,才有可能建立信任度和接受度的问题。创业公司要做的不就是把一个个的“0”变成“1”吗,有了“1”才有可能“2”有“3”,“3”生万物嘛。什么时候创业都有机会,因为这个世界永远都需要更便宜、更高效的解决之道。