欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  新闻

国产数据库的逆袭,OceanBase再造OceanBase

程序员文章站 2022-06-25 09:46:08
有这样一群人,他们原本是互联网大厂的“工程狮”,却一路选择了最难的道路,2010年,20人团队要“去IOE”中的O,甚至要和Oracle甲骨文、Google谷歌这些公司在数据库上较量一番。...
国产数据库的逆袭,OceanBase再造OceanBase

“不知天高地厚,是不是只是玩票。”质疑声从未停止。但偏偏这群最偏执的追梦人,在2019年的「数据库领域的世界杯」,打败了称霸这一领域9年的oracle。他们的梦想还不止于此,要让更多的企业都用上新一代分布式数据库。2020年6月8日,为了完成这个梦想,他们从大厂中独立出来创业。

十年冷板凳,这是属于这群最“偏执”人的追梦历程。今年,他们把300万行代码开源,创造属于自己的社区生态,这又是一项国内技术领域创举。在上周六的hicool 全球创业者峰会上,再次宣布“创计划”为中小企业“全免服务”。

聚集这群人的公司名为“北京奥星贝斯科技有限公司”,如果你对这个名字陌生,那并不意外。提起他们的产品,你也许听说过,名为“oceanbase”分布式数据库。如果再说起他们服务的客户,你一定不陌生,10亿级用户的支付宝平台,工商银行等200多家客户。

10年前,oceanbase为何立下flag,10年后,他们为何又从蚂蚁集团中独立?如今,又为何要独立打造自主的开源技术社区?现在,为何又要为中小企业提供全免服务?

在刚刚结束的hicool全球创业者峰会期间,北京奥星贝斯ceo杨冰接受了tech星球的专访,讲述了oceanbase战略发展的思考,以及开源、服务中小企业背后,再造oceanbase的逻辑,这群追梦人将自己演绎成了数字时代的主角。

底气

在科技互联网时代,芯片和操作系统是大家熟知的技术高峰,而数据库由于概念难懂,大众对其认知并不深刻。实际上数据库也是俗称的“卡脖子”技术。在 2020 年 6 月科技日报发布了制约我国工业发展的 35 项技术,数据库管理系统即名列其中。

一直以来,国内企业的数据库,大都采用的是oracle和ibm的传统关系型数据库。这两家企业在全球范围内,也是数据库的执牛耳者,oracle一家的全球市场份额就超过50%。但对于很多快速发展的互联网企业来说,数据呈指数级增长,数据库却只能搭积木式的维持。

“这个事情有专业词语叫scale up。”杨冰告诉tech星球,”就像是你拿了一辆车,不断地给它装更高的配件。四缸变八缸变十二缸,但是再怎么样加配,你也是只能不断的升级,而不是换代。“

传统关系型数据库的水平扩展能力的缺失以及高昂价格,让不少企业开始思考有没有更好的替代方案。方案肯定是有,当时谷歌发布了 google spanner分布式数据库。“这种新型数据库架构也叫scale out,支持水平扩展。“杨冰形象地向tech星球解释:”它可以连接形成一个网络,可以线性的扩展,只要加机器就有,这种方式就让它的处理性能没有天花板。”

当时,oracle不是没有意识到这种新型数据库的潜力,只是自己传统集中式的数据库,与互联网时代的分布式数据库,天然存在利益冲突。oracle没有决心革掉自己的命,还得在8年之后才深刻意识到。

oracle躺着赚钱的心思不难理解,但对于阿里来说,其不仅是oracle亚太地区最大客户,还是拥有全球最大的oracle集群。每年缴纳巨额的费用,却日渐无法满足淘宝和天猫的发展。这让阿里动了换掉oracle的心思。

杨冰回忆当时的起步缘由,创业团队从2方面考虑后决定做数据库。第一,现在淘宝的发展需要新型数据库,业务发展需要;第二个数据库相当于毕竟是软件领域当中的“芯片”,应该是软件当中,除了操作系统以外最难的产品。

“所以在这个层面上,我们也希望能够去打造一个中国的品牌,真正纯正的中国品牌,不是基于开源的技术。”很少有人知道,当时oracle是最好的外企offer,毕业生都以进入oracle、ibm和sap为荣,阿里和腾讯无论是薪资还是名气都还排不上号。

就是在这样的背景下,现北京奥星贝斯首席科学家、oceanbase创始人阳振坤等人,已经开始了研发之路。这里还有插曲,也正是当年选择了全部自研,10年后,oceanbase才能选择 open core 商业模式,将300万行核心代码全部开源。

没人能打包票一定成功,那时阿里还有很多团队在做数据库,大家的技术路线也并不相同。留给oceanbase的机会并不多,最早只是在淘宝的收藏夹,这样一个小场景中适用。

在oceanbase发展的第二阶段,得到了“阿里云之父”的王坚博士的支持,他说服了原蚂蚁集团的cto鲁肃。“新型分布式数据库在金融场景下应该是更适合。”

就这样,oceanbase并入蚂蚁,真正迎来跨越式发展,开始在蚂蚁集团的业务中登台亮相。杨冰说,“有一年双十一计划给我们1%的业务量,后来公司问我们双十一交易高峰给你10%行不行,我们说行。也没有别的选择,就来吧。然后顶过去了,顶过去就一战成名。”

国产数据库的逆袭,OceanBase再造OceanBase

在互联网场景中淬火的oceanbase,尤其经历蚂蚁集团的金融+互联网的锻炼,验证了其能力,也成就了oceanbase一张闪亮的名片。

最值得纪念的时刻,也是在oceanbase,他们实现了挑战技术霸主的愿望。

在2020年9月,数据库领域最权威的国际机构国际事务处理性能委员会 tpc 在官网发表了最新的 tpc-c 基准测试结果, oceanbase 以 7.07 亿 tpmc 的在线事务处理性能,打破了自己在 2019 年创造的世界纪录。

硬仗

技术上登顶后,能不能改变国内数据库市场的格局?

在oceanbase成立10年后,这群偏执的人又给自己提出了这些疑问。离开巨头的怀抱,oceanbase独立出发了。

产品能不能经受的住客户考研?能不能让客户心甘情愿换代?独立后怎么养活自己?这些疑问是这帮技术人才,过去没有考虑过的问题。在2020年6月份成立后,他们还是勇敢迈出了这步。

但迎接ob的,并不是鲜花和掌声。如今中国现在两百多家数据库,现在数据库已经构成当年滴网约车大战,共享单车大战那种感觉。“大家都在搞,也是因为开源把入门的门槛变低了。”

这些开源的数据库产品,往往是基于mysql或postgresql 进行二次开发。演化的路径也分为两个派系,一方面oltp(事务型),另一方面是olap(分析型)。但企业发展至今,往往需要两者数据库配合使用,但两者配合使用时存在延时的问题。这时候,htap型数据库就开始成为新一代主流数据库类型。

oceanbase就是这种数据库的代表,由于htap基于分布式架构,支持弹性扩容,可轻松应对高并发和海量数据库场景。但也是相对传统关系型数据库的这些优点,让不少企业开始质疑,oceanbase的产品,真的有这么厉害吗?

中国人保健康也经历了这种从质疑到相信的过程,在最初,中国人保健康后台需要离线处理保单,系统效率平均下来每单需要耗费 5 秒的时间。在接入支付宝合作后,巨大的流量冲垮了其传统的集中式架构。这时候支付宝自身采用的oceanbase分布式架构,走向其视野。

采用oceanbase的架构后,最明显的变化是,处理能力也从过去的 5 秒 1 单到现在每秒千单,系统保单的处理速度从 4 个小时缩短为 6 分钟。业务前台接入互联网,后端采用新一代数据库处理业务,中国人保健康也体验了一把“互联网速度”。

国产数据库的逆袭,OceanBase再造OceanBase

不仅是中国人保健康,在为期3个月的观察验证之后,中国工商银行与蚂蚁集团oceanbase、阿里云技术团队共同制定主机下移方案,并于今年9月正式投产。两地三中心的分布式集群,五副本+主备模式的高可用,传统金融单位也越来越信任oceanbase。

事实上,国内外的金融和电信行业,曾经是oracle和ibm的数据库绝对垄断的领域。在oceanbase不断攻克传统金融巨头时,难道oracle没有反击吗?

oracle一直是王者,但英雄迟暮也是众所周知。2019年5月,一则oracle中国区首批裁员900人,赔偿n+6的消息爆出,揭开了oracle大调整的序幕。背后oceanbase等国产数据库的进击,以及oracle市场份额从垄断到跌落至17%左右。

oceanbase的成人礼

创业后,oceanbase也体会到独立过日子的不容易。

“以前是一个产品技术主导的一个体系,但是从去年开始,我们成立商业化团队之后,我们要把客户放在第一位。因为我们得从内走到外面,得到市场的肯定。这个时候客户的业务环境不同就有定制化的要求,我们就要去做定制化的开发。”

独立后的oceanbase树立10大标杆客户,主动上门布道,主动提供vip服务,让客户真正把oceanbase用起来。

国产数据库的逆袭,OceanBase再造OceanBase

在这些企业中,使用效果如何?据杨冰告诉tech星球,比原来集中式的数据库使用成本几乎降低一半:”50-80%都有可能,规模越大节约成本久会越大”。

但是它会有个下限,据杨冰介绍,如果客户只有三、五台,那就没有这个效果,如果说超过七、八十台,一百台mysql的实力,这个规模下如果全部换成oceanbase,效果会很明显,起码砍一半成本以上。

但对于想颠覆国内传统数据库的局面,oceanbase还有很多事情要做。最关键的地方在于,尽管oceanbase兼容mysql、oracle等传统数据库,但是oceanbase的产品如何更快被企业接受,如何快速建立起不同于mysql和postgresql的第三套自研生态体系,都是一件任重道远的事情。

过去10年,杨冰形容oceanbase是在阿里巴巴和蚂蚁的这种“双十一”喂出来,磨出来的,在最复杂和海量的业务环境中磨练出来。但在未来如何打动中小企业,吸引其替换底层数据库是重点,“分布式数据库还是一个巨大的新兴的市场,google spanner 还没有开源,oceanbase在国内率先开源共创,就是期待抓住这一时代机遇。”

杨冰具体解释道:“因为开源开放很多参数可以调,很多其实他自己可以去适配,所以会更容易。我们在今年的6月1号,正好成立1年的大会上宣布开源。”这次开源后,开发者更容易下到oceanbase的代码,看到oceanbase的原理,中小企业可以去diy去使用和调配。

据了解,在9月份的hicool 2021全球创业者峰会上,杨冰正式宣布“创计划”。“创计划”强调“全免服务费”, 解决中小企业数据库的技术痛点,首期“全免服务费”权益向100家中小企业开放。免费服务项目包括:前期的技术咨询、人才培训、数据迁移等全链路的技术服务。

创计划的推出,也意味着国产数据库的开源与服务中小企业口号,不是玩虚的。与国内众多企业一起共创未来,这将促使100%自主研发的oceanbase进化成何种模样,也是件值得关注的事情。

据介绍,目前在生态合作方面,oceanbase 在产业端也与40家伙伴完成了深度合作;oceanbase 认证工程师达到1万+;技术/服务类伙伴也拓展至12家;此外还投入千万级资源参与高校人才建设;而在客户服务方面,目前 oceanbase 也累计服务200家客户。

“在中国并不缺一家数据库的公司,但却缺少一家真正能够完成核心替代的高端数据库。”杨冰总结道,期待oceanbase 可以实现最终梦想,成为国内外企业做最多选用的分布式数据库。