数据中台落地,是下一个平台型创业机会
2019年的科技圈,最火概念之一就是“数据中台”。
去年年中,数据中台的百度指数还在120徘徊,今年春节后翻倍涨到了300,今年6月已经达到500。
近期贴上该标签的公司也越来越多:
应用层做大数据营销、风控saas的公司;技术底层做数据仓库、开发平台的公司,如星环科技;一些转型云服务的传统软件商,如用友、金蝶,纷纷宣布开辟了数据中台业务。
在新概念“保鲜期”越来越短的时代,这股“数据中台热”,既让人看到了“风口”的身影,又让人嗅到了“炒作”的气息。
和大量新概念诞生时的境遇一样,数据中台目前正处于一个探索中的“定义混乱期”:
比如用友把数据中台作为其云平台的一部分,同时提供业务中台和技术中台;咨询机构罗兰贝格认为数据中台的本质是数据共享、整合和深度分析;奇点云ceo张金银强调数据中台的能力是“计算平台+算法模型+智能硬件”,不仅有云端,还需要智能设备帮企业在终端收集线下数据……从服务方到客户方,不同参与者对数据中台本质的理解并不相同,一千个读者有一千个哈姆雷特。
本文,「甲子光年」深度采访了国内第一家企业数据中台服务的独立供应商——成立于2016年6月的数澜科技。
这家脱胎于阿里数据中台的初创公司,见证了赛道由冷到热:
2016年到2017年,数澜的中台客户只有3家;2018年的新增中台客户则达到十余家;截止5月,今年的新增中台客户已有数十家。代表客户来自各行业头部,如万科地产、方太集团、雪松控股、中信云网、兴业银行、时尚集团、视源电子、喜茶等,数澜的收入也随之高速增长。
到底什么是数据中台?怎么做数据中台?对应的真正市场机会究竟在哪?
已系统探索了3年的数澜有独到的理解和不容忽视的发言权。
1.为什么数据中台突然火了?
中台概念火起来,直接的导火索是近一年来batj等大小巨头的摇旗呐喊。
2018年下半年开始,以中台战略为核心的组织变革浪潮席卷互联网圈,与各巨头高调转型to b同步发生,“你方唱罢我登场”:
· 2018年9月,腾讯宣布新成立云与智慧产业事业群(csig)和技术委员会,后者将负责打造技术中台。
· 2018年11月,阿里云事业群升级为阿里云与智能事业群,并开始对外输出中台能力。
· 同月,美团被曝正在打通大众点评、摩拜等各业务间的数据,构建数据中台。
· 2018年12月,百度调整组织架构,王海峰同时负责基础技术体系(tg)和ai技术平台体系(aig)。此后,王海峰在公开场合表示,打造技术中台是百度调整组织架构的战略方向之一。
· 同月,京东进行有史以来最大组织架构调整,增设中台部门,京东商城ceo徐雷还在去年年会上强调:要将中台提升为“永不停歇”的超级引擎。
· 2019年3月,字节跳动被曝正在搭建“直播中台”,抖音、西瓜、火山视频3款app未来将共用技术和运营团队。
和云计算一样,这一回合,阿里巴巴又担当了新概念“鼻祖”——是中国乃至世界第一家系统地践行了中台战略的大型互联网公司。
一切的起因是2014年马云的一次欧洲之旅。
在参观了开发出《部落冲突》、《皇室战争》等手游的芬兰公司supercell后,马云有了一个新奇的发现:
supercell并不像大多游戏厂商那样,按不同游戏划分开发、运营团队,而是多款游戏共用开发。这种做法在supercell被称作“中台”。
“中台”,源自美军作战概念:通过高效、统一的后方系统,来支持前端的机动部队,提高作战效率,减少冗余投入。
supercell启发了马云。
彼时,阿里内部已出现不同业务线“重复造*”,资源利用率低的问题。马云当机立断,全面推广“中台”战略。
2015年12月7日,时任阿里巴巴集团ceo的张勇写了一封内部信:“今天起,我们全面启动阿里巴巴集团中台战略,构建符合dt时代的更创新灵活的‘大中台、小前台’组织机制和业务机制。”成为证明阿里强战略性的又一广为人道的理念。
一个小插曲是,在马云参观的两年后,supercell被腾讯收购了。
经过最初的摸索,阿里将中台定型为3个部分:技术中台、数据中台和业务中台。
而数澜科技的创始团队,正来自阿里巴巴的数据中台部门。
其创始人风剑(甘云锋)当时担任阿里集团数据平台事业部数据服务部负责人,是一手建立起阿里数据中台的骨干人物。
如今,市场中关于中台的各种讨论之所以显得“鸡同鸭讲”,正是因为其内涵有多个层次,而真正做过的人并不多。无先例可寻,阿里的中台摸索,靠的是一次次踩坑,一次次爬出来的实践。
数澜的阿里背景,正是其天使投资人idg资本合伙人牛奎光押注数澜的原因:
“‘见过猪跑’,是一个很重要的先进生产力。”牛奎光告诉「甲子光年」,数澜的核心竞争力概括起来无非两个字——“玩过”。
真正“玩过”的数澜团队,把他们对数据中台本质的思考凝结成了以下的描述:
“帮企业把数据用起来,连通传统it架构和各类型数据,最终提升决策水平、业务表现的一套数据运营机制。”
数澜的企业使命也正是这句话的精炼:“让企业的数据用起来。”
为什么这是数澜眼中数据中台的本质?
这背后,蕴含着中国企业信息化需求和痛点的变迁。
2.数据中台的本质
十几年来,中国企业已经历了信息化的3个阶段。
第一阶段,是2000年之后的企业内部信息化。
2002至2005年之间,中国许多大型企业开启了一波以数据库、erp为主的底层it建设。
这类系统从部署到更新、淘汰,生命周期一般在5年左右;第二次的更替也需要同等时长。
于是,2015年前后,中国许多大型央企、国企和龙头民企都基本完成了内部核心业务的信息化建设,做到了“将一部分业务沉淀为数据”。
这为数据中台的出现提供了第一个先决条件:底层it架构的完善和初步的“业务数据化”。
和第一阶段部分重叠进行的第二阶段,是2004年到2012年,全行业萌发的“互联网思维”。
这一时期,随着bat纷纷上市,互联网经济从“穷小子”变成了“富爸爸”。所到之处,“消灭你,与你无关”。备受电商冲击的传统零售商,被搜索和门户打得黯然神伤的传统媒体,都是这一轮更新换代中的失意者。
仿佛一场“盗梦空间”,各行各业被深深植入了一个信念:互联网思维。
而互联网思维中,尤为重要的就是数据思维。
这为数据中台准备了第二个条件:企业客户开始意识到数据的巨大价值。
第三阶段是2013年之后,移动互联网大发展,为各行业提供了大量数据通道。
移动互联网从虚拟世界走向线上线下深度融合。对于场景多在线下的传统行业而言,低门槛的数据渠道成为了可能。通过app、小程序和蓬勃发展的各类传感器,更多行业积累了原生于移动互联时代的量级远超以往的多维度海量数据。
而新的数据渠道又带来新的业务需求。比如,以数据为支撑的营销、风控、辅助决策类业务,让许多企业近年内开始用起了saas。
这为数据中台准备了第三个条件:更深程度的“业务数据化”,和对自有数据价值的更深认知。
随着以上三阶段的发展,中国企业在信息化上开始涌现两大相似痛点:
1.管理稳定性和业务变动性之间的矛盾加剧。
管理求稳。而各行业互联网化后,面临着场景、业务增多且快速变动的情况。
上层的业务需要灵活性,企业的管理和战略又需要相对稳定,二者的矛盾越发不可调和。
风剑认为,这个矛盾达到一定程度时,就是数据中台兴起的时机。
2.新旧it系统沉淀的数据之间难以打通;企业内外部数据难以连接。
为了满足新业务的即时需求,许多企业同时使用着包括小程序在内的多种saas,不同工具有如一个个林立的烟囱互不连通;又和企业底层“差着辈分”的老一代erp、数据库等it系统有着交流“代沟”。
牛奎光告诉「甲子光年」,数据中台的核心市场需求正在于此:“老系统和新业务之间,需要一个‘路由器’。”
用风剑的话说则是:“企业外的用户行为数据和企业内部数据发生关系的地方,就是数据中台的空间。”
回顾这段前史,数澜对数据中台的定义——帮企业把数据用起来,连通传统it架构和各类新型数据,最终提升决策水平、业务表现的一套数据运营机制——就很好理解了:
数据中台,通过解决传统it架构和各类新型数据、业务的矛盾,化解了求稳的管理和求变的业务间的矛盾;既提升管理、决策水平,又带来更好的业务表现,帮企业实现商业本质。
而定义中最重要的一点是数据中台的形态:“一套数据运营机制”——既然是“机制”,就需要企业战略及组织架构等全方位的规划和配合,而非仅仅是工具和产品。
数澜首席运营官武凯归纳,数据中台能不能做好:第一看战略,第二看组织,第三才是工具。
以数澜的客户中信集团为例,它旗下拥有横跨金融、地产、零售的多条业务线。这不仅是技术问题,更是内部利益协调问题,需要顶层战略设计和组织架构上的支持——这就是为什么各大互联网公司在宣布中台战略时,纷纷伴随着组织架构调整。
于是,数澜在提供数据中台的服务时,会提供一整套工具+咨询服务。
风剑向「甲子光年」强调,数澜卖的不是数据中台,而是搭建、运营数据中台的能力,因为每个企业的数据中台都不同:“阿里的搬到恒大,肯定用不了。”
“我把它叫工具+方法论+行业最佳实践。”风剑说。
其中,“数栖平台”是以数据资产为核心,将数据集成、数据开发、机器学习、数据治理、数据质量、数据安全和应用服务等能力进行整合的一站式大数据平台,这解决的是工具问题;而在战略和组织上,数澜则会提供细颗粒度的咨询类服务——比如协调部门关系,促进数据交流的具体建议。
实际上,数澜能撬动很多大型标杆客户,正是靠这种提供决策建议的认知能力和方法论经验。
风剑举了个例子,他们正在服务的一家大型民企,此前曾找国外技术公司做过类似数据中台的尝试,但半年下来,进展缓慢。
2018年,这家公司找到了数澜,抱着聊聊看的心态,他们请风剑去讲了一次课,几十个高管悉数到场。
7小时过后,对方彻底听服了。这家在风剑的描述中“绝对看不上我们小公司的客户”,最终和数澜达成了合作。
3.为什么一定要做平台?
虽然现在正享受着“走在风口”中的推背感,但数澜在2016年起步时,开局艰难。
由于数澜把数据中台定义为一套底层通用能力,并不直接解决客户的具体业务需求,所以它面临一个很大的难点——难以测算数据中台为客户带来的具体价值,也就难以说服企业客户付费。
这有点像西医和中医的区别,前者头痛医头,对症下药,是应用手段;后者调理基底,增强体质,是基础设施。
在2018年之前,这种无法测算具体价值的隐忧,让数澜的早期投资人牛奎光和风剑之间存在切入市场的策略分歧。
牛奎光想的是“纵”:他建议数澜先收敛到某一个行业,围绕行业真实痛点切入市场。
而风剑想的是“横”:从一开始就做基础设施,走平台路线。
数澜内部,对此也有分歧。
产品出身的武凯最初反对做平台,他站在客户视角想:解决了我什么问题?解决了百分之几?能增加多少利润?但做平台就“讲不清这些事”。
面对内外双重压力,风剑对平台打法的坚持和底气来自于一个趋势判断和一条自我认知。
一个趋势判断是:烟囱已打好,平台来收网。
风剑偏好长尺度的历史思维。在横纵路径这件事上,他琢磨出一个延续了50年的规律:细分领域先行,平台一统天下。
“数据库时代,先有各类垂直型数据库,最后是综合型数据库一统天下;软件时代也是如此,在erp之前,有ats软件(人事招聘管理系统)、mrp(制造资源规划系统)、oa(企业内部办公自动化系统)等解决各类业务的软件,后来也是被通用的erp收归。”
风剑认为,云计算和大数据时代,同样的故事会再来一遍:垂直类数据应用先行,最后数据中台这样的平台型应用会整合生态。
而风剑之所以判断2016年是一个可能的创业时机,正是因为在经过2012年以来的发展后,许多细分领域的“烟囱”已经建好。
这些烟囱帮企业客户积累了数据和数据渠道;同时也导致企业在应用大数据时越来越复杂,逼迫着他们去重修底层基础设施,以适应新环境。
数澜有一家金融领域的客户,在找到数澜前已使用了6个大数据工具,分布在营销、风控、组织、建模、数据分析等业务中。
随着工具越来越多,这家企业出现了一系列管理问题:数据资源未打通,难以业务协同;重复建设数据能力,增加了企业成本;工具太多,部分流程复杂化。所以他们有“打通上下、融为一体”的迫切需求,数据中台正当其用。
一条自我认知则是:数澜的基因不擅长做业务应用。
数澜的8位合伙人中,5位都是当年阿里数据中台的技术出身,在阿里一直做的是“离业务较远的事”。
风剑清醒地认识到,以数澜一个团队的力量,难以在金融、地产、制造业等多个领域都获得深度行业认知,不应该承担支撑客户具体业务的使命。
事实上,在冷启动举步维艰的时刻,数澜也曾有做上层应用的尝试,但事后证明是弯路。
2016年,数澜就给他们的第一个客户万科做过地产垂直领域的产品:域见,做业主满意度服务运营。
当时这个产品万科用着挺好,数澜团队很兴奋,认为别的房地产公司如碧桂园、恒大等也有类似需求。
于是2017年,数澜成立了“地产事业部”,结果真到水里一摸,温度不对:“根本做不起来,这些地产公司对数据的理解和需求差异很大。我们很难弄懂每个客户的具体痛点。”
经此挫折后,数澜调整状态:从“端到端做解决方案”重回平台输出。
在2018年,数澜甚至开始推一个新策略:所有客户必须用数澜的数据中台,数澜才会进一步参与做业务,否则不做。
“(数据中台)这个东西不可避免,它只有一条路可以,就是平台的。”风剑说。
4.落地的数据中台长什么样?
在实行了“强推平台”的做法后,数澜的业务反而更顺了:
2017年,数澜只有几个中台类型的客户,到2018年扩展到十余家,今年上半年,新增客户进一步增加到数十家。
顺利得益于风剑此前看到的机遇正从可能性变成现实:
越来越多的企业在经历了业务层搭建数据工具的过程后,到了用顶层战略进行“内部统一”的时刻。
数澜华北区总经理子曰(孙昂)告诉「甲子光年」,2018年初接手工作时,他遇见的客户是“好奇的多,真下决心的少”。在他当时见过的各种企业cio和央企信息部总经理中,8成的人来时只有意向,但无具体预算和计划。
而到2019年,一是找过来的客户数量大增;二是许多人已对数据中台有一定认知,他们是带着详细的需求报告及方案有备而来的。
和这些行业客户一起,数澜打造了一个个实际落地的数据中台。
数澜的一个典型客户是中信。
二者从2018年4月开始正式合作,中信当时想集中解决两大问题:
一是业务上,作为跻身世界500强的大型央企,中信旗下有中信银行、中信证券、中信地产、中信出版社、麦当劳中国等横跨b、c端的多元业务,但各业务的数据各自为战,没能形成集团协同效应。
二是技术上,中信此前已尝试了一些数据管理、开发平台,算法模型平台,但这些平台能提供的整合能力依然有限,而且用的平台越多,内部反而越复杂。
针对这些问题,数澜有计划地为中信提供3层数据中台能力,这也是数澜的平台产品“数栖”核心要做的3件事。
一是数据交换,对应数据交换平台。
从组织和战略上来说,要做数据交换,先得进行意识统一和组织调整,让各部门“愿意把数据拿出来”。
中信在这一点上已有建设。中信集团董事长常振明作为公司一把手在“互联网+”转型上的态度鲜明,中信已于2016年成立了中信互联网+转型小组,统筹集团的互联网转型,包括中信云、中信大数据等。
从技术上来说,数据交换就是多套异构、异域的it系统、工具之间的数据打通。
风剑介绍,如果一个大型集团有两套erp,比如一套甲骨文的、一套金蝶的,过去要做应用时两套东西很难合在一起,因为底层数据库的结构、定义不一样,“可能花一两年都搞不定”。
而数澜专门开发了一个多云、多数据库打通的“数据网关平台”模块——不管数据在哪儿,都能通过软件层的工作,把它们糅到一起。
“不要小看这个能力,这是我们很多大型客户的必选项。”风剑告诉「甲子光年」。
二是数据资产化,对应数据开发平台。
数澜对数据资产的定义是:业务上可直接使用,产生价值的,可理解、可阅读的数据。
实现这一点的是数澜庞大的数据开发平台,其上包含ai算法平台、数据安全、治理、监控、运维等多种能力。
在实现数据资产化上,数澜有两个要点。
第一,数澜不仅提供数据资产化工具,也提供相应的方法论和咨询服务。
第二,数澜的数据资产化不是围绕诸如营销、风控等业务展开,而是围绕场景展开。这背后的思考是,业务是多变的,而场景相对更稳固,从做基础设施和能力沉淀的角度出发,应考虑更稳固的、通用的需求。
在2018年,数澜已为中信提供了以上两层服务。
2019年,数澜与中信的合作也将进入第三层的探讨:数据业务化,期望能让变成资产的数据进一步帮助业务取得更好表现,甚至是开辟全新业务。
在服务中信4个月后,数澜又在2018年8月开始服务首个传统媒体类型的客户——旗下拥有《时尚cosmo》、《时尚先生》、《时尚芭莎》等著名杂志和ip的时尚集团。
和中信集团的一把手拍板一样,时尚原董事长刘江对转型的态度非常坚决,转型开启后,时尚新成立了数据平台管理部。
该部门总经理刘容告诉「甲子光年」,时尚面临的问题是:很多内容做完就扔了,客户关系的维护也缺乏系统性,内容资产、客户资产比较散乱。在选取数字化合作伙伴上,他们并不特别看中价格,因为这是“战略的事”,几乎不计成本。
拆解来看,数澜给时尚提供的服务仍是3层:
数据交换——集合各刊司的电子扫描件、音视频等内容,并补充部分过往缺失数据。
数据资产化——在以前的扫描件里提取图片和文字要素,并打好标签,使其成为业务人员可阅读、可理解的内容。
数据业务化——以第一期工程的数据为载体,构建内部内容搜索引擎,助力集团业务转型。
时尚员工可通过这一引擎快速查阅围绕某一人物、主题或元素的时尚以往的内容积淀,这有助于提高内容策划的效率。
去年底,在搜索引擎上线的第二天,时尚集团副总裁余辉就利用这一工具制作了一个和故宫合作的方案,用时仅30分钟。
今年1月1日,时尚开始了和数澜的第二期合作,合作内容将从内容资产库,扩展至用户库和资源(客户资源)库,并开始探索数据业务化,可能的方向有:基于内容库做二次生产,部分的自动化策划、版权输出;基于资源库,开展明星经纪服务;拓展旅游、电商等新业务。
在房地产、金融等领域,数澜如今也已积累了大量客户。
和2016年刚起步时不同,行业爆发期正在到来。
5.大机会,谁的机会?
对于数据中台的机会到底有多大,爆发在何时?风剑十分敢下判断。
他的豪言是:数据中台可能是未来20年最大的机会。
他判断,今年8、9月份,数据中台赛道可能迎来第一个小高潮。
“小高潮”表现在客户端的需求会更加旺盛,且如今行业内“众说纷纭”的数据中台概念将逐渐收敛,达成共识。
风剑相信,数澜对数据中台的定义最终会在这场“定义之争”中胜出。
风剑还相信,2021年,数据中台赛道会迎来第一个真正意义的爆发点。
风剑给出了很量化的描述:今天,国内大概只有千分之一的企业认为自己需要数据能力,而到三年后,这一比例会到十分之一,且其中有四分之一的企业都需要数据中台。
“数据中台可能诞生千亿甚至万亿级的新公司。”风剑判断。
当然,真要抓住这个机会,数澜的对手不少。
第一派,是与其成立时间相似的大数据平台类企业。它们虽没有像数澜这样,最早旗帜鲜明地提出要做数据中台,但也渐渐进入或被人归为这个赛道,如北交云、袋鼠云、奇点云等。
另一派,则是传统软件服务商中的佼佼者,老一代it架构的建设者,如金蝶、用友等。
第三派,是从上下两个方向向数据中台挺进的玩家:如原本主打产品是解决营销、用户运营问题的saas厂商;以及原本在更底层,做大数据分析平台和开发平台的公司。
当然,还有哪里都绕不开的bat三座大山。目前,腾讯仍在对内建设中台能力;百度的ai to b其实有对外输出智能中台的意思;而阿里则已在去年的组织架构调整后,开始明确对外输出基于阿里云的中台能力。
作为长期关注大数据赛道,投资了多类型中台公司的投资人,在判断如今战局时,idg的牛奎光给出了一种简洁明了的思维路径:
阿里做数据中台出来的人,能投都投——他也投资了奇点云、滴普科技、非码、dmall等涉及中台业务的公司。其投资逻辑还是前文提到的那点:做过相比没做过,是巨大的优势。“就好比mba我们先投了;大学生慢慢长,长出来之后我们再继续琢磨。”
而被问及创业公司与巨头的竞争,他承认阿里很强:
“这事儿是他(阿里)最早做的,另外他劲儿大,所以他很可能是最大的受益者。但巨头并不可怕,因为to b市场本来就不是赢家通吃,创业公司有机会获得非常可观的市场份额。”
风剑却认为,数澜等创业公司真的不一定会输给阿里。
他的信念之一仍是历史时常反复上演的规律:
在数据库发展初期,ibm和甲骨文相互竞争,按理说ibm有钱、有人,不应该做不过新秀甲骨文。
但大公司有大公司的惯性。当时ibm的主营业务是服务器,做数据库的终极目标是卖服务器,醉翁之意不在酒,最终未能敌过全力以赴的甲骨文,失去了在数据库上的机会。
此时此刻的阿里与ibm的情况有相似之处,依托于阿里云对外输出中台能力,这一安排确实被外界和部分客户质疑:是不是还是为了卖云?
其中还有一些现实的难点:大型企业一般都会采用多云策略,不会把数据放在一个服务商,当既是云服务商又是中台服务商的阿里要去做数据中台的多云、多数据库的数据交换时,是否会被别的云服务商穿“小鞋”?这种由卡位和立场导致的生态受限,是巨头要进军这一领域时必须解答的问题。
不过,对创业公司来说,他们也有不得不直面的“灵魂拷问”:
目前,大量大数据公司真正赚钱的方式,仍是定制化开发占比较大的项目制。而他们讲的故事却是:项目是用来积累经验的,未来必将走向产品化、标准化,以实现低成本的规模化。
这个承诺能实现吗?从定制化到标准化的路径是什么?
在数据中台这种和客户战略及组织密切相关的重型建设上,这一问题尤其难解。
另一位看过数澜等多家数据中台的投资人就告诉「甲子光年」,他认为这些公司都“太贵了”。
他很怀疑这些公司能真正做出通用性产品:“说是云原生、微服务、模块化,到底定制化程度多重?现在看不出来。目前看,他们更偏原来的定制开发。”
如何跃过龙门,真正从做项目变成做通用基础设施?其实在创业之初,数澜就有一套达到标准化的设想,并做了两手布局:
一是将数据中台方法论标准化。
即一条条拆解建设数据中台所需的能力和步骤,让市场对数据中台达成需求共识。这种共识越广,赛道越有可能出现通用能力提供者。
目前,数澜已成立了进行数据中台企业培训的数澜大学,并在今年做了6次《数据中台硬核汇》微课,尝试向全行业无保留地输出方法论。
二是引入idv,构建数据中台生态。
数澜未来将更加专注于提供包括数据标签、数据交换在内的通用底层数据能力,而将上层的多种数据应用,如数据可视化、营销、风控等交给合作伙伴或独立开发者。
这些开发者类似云计算生态上的isv(独立软件开发商);在数澜的生态里,他们被定义为idv(独立数据开发商)。未来,数澜将和idv一起服务最终客户。
围绕这个生态打法,武凯向「甲子光年」透露,本周六,数澜将在杭州梦想小镇举办的数栖大会上,对外宣布数栖平台的重大形态和商业模式升级,并推出帮助合作伙伴加入数澜生态的“helios project火种计划”,不过具体情况现在还得卖个关子。
若这些精心谋划的战术,真能跃过通用化、标准化的龙门,能上手使用数据中台的企业将不仅仅是大型企业,还包括数以十万级的腰部企业。
到那时,数澜等初创数据中台公司的命运,也许会更靠近风剑说的那片星辰大海:
“未来20年的dt时代,一定会出现超越bat的公司。这个新巨头不可能在bat内部诞生,也不可能带着bat的光辉诞生。它一定诞生于独立的创新公司。”