欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

华为云 GaussDB 数据库,会是新的国产之光吗?

程序员文章站 2022-07-03 09:04:58
7月20日,华为云TechWave技术峰会上,华为云数据库业务总裁苏光牛正式发布两大数据库新品,包括关系型数据库GaussDB(for MySQL)和非关系型数据库GaussDB NoSQL系列。 仅半个月后,GaussDB又迎来了新一轮更新。...

华为云 GaussDB 数据库,会是新的国产之光吗?

华为云数据库业务总裁苏光牛

7月20日,华为云TechWave技术峰会上,华为云数据库业务总裁苏光牛正式发布两大数据库新品,包括关系型数据库GaussDB(for MySQL)和非关系型数据库GaussDB NoSQL系列。

仅半个月后,GaussDB又迎来了新一轮更新。在华为云TechWave·数据库专题日上,华为云数据库业务总裁苏光牛详细介绍了GaussDB这个华为的战略性数据库产品的来历,并发表了他对于数据库发展的一些看法。

GaussDB数据库升级下的大调整

苏光牛谈到,在宣布战略性调整之前,外界还有人在质疑,华为在做数据库的态度上并不坚定,GaussDB算不上是华为的战略性产品。本次发布后,这种质疑很快被打消。

其实这从华为对数据库的战略性投入可以看出,比如数据库专业人才的投入和高端专家布局,数据库是人才专家密集型高门槛基础研究,华为有1000+数据库研发专业人才,还有100+布局全球7大区域的数据库内核引擎、算法等高级专家和大咖,这只是数据库的研发人员,并不包含内部为华为云/流程IT/消费者云等数据库底座服务的DBA、SRE运维人员、工具平台开发人员,还有华为云数据库的销售、交付与服务人员;比如数据库研发历史和标杆客户的选择,华为从2007年开始已经持续战略投入数据库超过10年,早在2014年开始就持续和工商银行、招行等头部标杆客户长期联创;再比如华为在生态构建上的战略耐心,数据库是讲究生态的产业,华为不仅积极参与推进数据库产业生态发展,而且注重高校生态、开发者生态等建设,开源和持续运营openGauss社区,积极拥抱开放的生态,如MySQL、PostgreSQL、Mongo、Cassandra等。

宣布战略升级后,华为在数据库业务、组织、生态上做了重大调整。

a) 业务上:将传统线下数据库的纯软件销售和交付,调整为依托华为云与华为云Stack,以云服务方式持续为客户服务,加持云后一方面提升交付与运维效率,帮助客户聚焦核心业务创新,同时为客户持续带来创新技术和新服务。

b) 组织层面:将华为数据库研发组织融合,统归华为云BU和2012高斯实验室,统筹数据库战略与布局全球七大区域11个研究所的1000多数据库专业人才,力出一孔,持续打造世界级数据库。

c) 生态方面:华为2020年6月30日开源openGauss社区版本并持续运营,与合作伙伴、高校、开发者共同繁荣生态。同时,华为将鼓励有能力的合作伙伴推出基于openGauss的数据库,旨在和业界共同繁荣数据库产业生态。

GaussDB数据库的前世今生

GaussDB(for MySQL)、GaussDB(for Cassandra)、GaussDB(for Mongo)从2019年Q4开始公测并在少数内外部大客户项目,如华为消费者云与WeLink、某大型保险公司、国家某部委等试点商用,优化数据库性能和高可用性后,于2020年7月份正式上线规模商用。

据苏光牛透露,未来华为云还将推出GaussDB (for Redis)、GaussDB (for Influx)等系列新服务。

这次,华为云在品牌命名上统一归到GaussDB,代表华为数据库品牌,立足创新与自研,基于同一架构,一方面拥抱并兼容MySQL等生态,另一方面打造自己的openGauss生态,主要面向政企客户,强调高性能、高可靠、高安全等方面诉求,给客户一个清晰明确的定位认知。所以,GaussDB(for MySQL)并不是简单的改名,而是在融合后,基于架构优化和改进后,结合品牌调整的结果。

调整后的GaussDB数据库云服务包含关系型数据库GaussDB(for MySQL)和非关系型数据库GaussDB NoSQL系列,支持文档类型(MongoDB)、宽表类型(Cassandra)、时序(InfluxDB),K-V(Redis)等多协议接口。

如今,最新版本的GaussDB系列产品实现了很多技术上的更新和迭代。

GaussDB(for MySQL)基于华为最新一代DFV分布式存储,采用计算存储分离架构,支持1写15读的只读节点的极速扩展,最高支持128TB的海量存储,可实现超百万级QPS吞吐,单节点相比原生MySQL性能提升7倍,业界第一。

GaussDB系列数据库支持NDP(near data process)技术,可以让计算和数据进行融合,加速数据的处理,从而大幅提升整体的性能;GaussDB NoSQL拥有极强的多模数据管理能力,在并发读写能力、扩容时间缩、故障重构时间、备份效率、恢复效率等方面也都实现了业界领先,相比纯开源软件能力有了质的飞跃。

不断完善的工具生态

对于开发者来说,有什么好用的工具是他们很关心的问题。

苏光牛介绍到,目前华为的数据库工具服务统一支持开源数据库服务和自研GaussDB数据库服务,当前成熟商用的有为客户提供上云的数据复制服务DRS、数据管理服务DAS、分布式数据库中间件DDM,同时下半年还会发布数据库和应用迁移工具。

其中,数据复制服务DRS能实现在线数据的迁移,业务切换微中断,业务切换时间可以*选择,同时还能跨数据库版本热迁移,给出迁移/升级后直观的性能评估报告,从而让客户的原数据库切换到华为云上更加简单、安心;数据管理服务DAS可提供便捷的云上数据库管理与运维服务,核心能力包含数据库查询与开发、运维监控、性能诊断、SQL调优、数据安全管控、智能参数预测等;分布式数据库中间件DDM与RDS结合,把当今成熟的水平扩展分布式数据库能力,以单个数据库实例的访问体验,带给普通用户。保证SQL运算及事务能力,存储和计算层几乎无限扩展。

替换IOE数据库将是个长期的过程

GaussDB的推出,让互联网厂商去IOE,数据库国产化的讨论和呼声再次热烈起来。

在苏光牛眼中,数据库国产化的机遇是否已经成熟?要走出一条不同于国外主流数据库厂商的路,中国要怎么走?

苏光牛坦承,逐步替换迁移IOE将是个长期的过程,至少未来3年内是这样。

为什么大家要放弃用惯了的主流数据库产品,要进行替换迁移?

他认为,厂商迁移数据库的核心原因,一是传统scale-up的扩展能力无法满足客户业务的需求、面向互联网+创新等业务,客户需要从集中式转向分布式云化的部署,在迁移到华为云数据库之前,客户主要采用的数据库大多并非一种,而是多种数据库产品结合,比如在金融行业传统核心账务系统,大的银行多使用IBM大机+DB2,这样做的封闭系统扩展能力较弱,且维护费用相当高,未来运维也是问题,所以,未来大机逐步下移会是一个趋势,但需要一个过程。

其次,厂商普遍达成了共识,需要业务和数据库一起来进行优化和调整,才能达成目标。

再次,互联网的去IOE和其它行业的去IOE挑战不太一样,从完美sharding的分片到复杂查询的场景,数据库的能力需要在严苛的标杆客户场景得到联创验证和孵化,同时要能联合为客户兜底应用的ISV,自身提供完善的系列工具迁移/运维/管理打消客户疑虑,真正地为客户做到平滑迁移。

这意味着,数据库国产化是一个循序渐进的过程,不可能一蹴而就。目前国产数据库还不够成熟,要提高国产数据库服务水平,打破Oracle、IBM、微软等国外数据库产品的包围,就需要走一条不同于它们走过的道路。

这条道路应该怎么走?从哪些层面着手?苏光牛有自己的思考。

他说道,一方面,华为云积极拥抱并完全兼容和支持业界主流的关系型数据库生态,如MySQL、PostgreSQL及非关系型数据库 MongoDB、Redis等生态,比如openGauss对外开放,避免让客户从封闭的Oracle走向另外一个封闭的“新的Oracle",而是与更多“同道中人”一起解决缺陷。

“因此, 华为云GaussDB数据库全面满足不同客户的需求,在架构、软硬件协同方面自主研发,同时生态兼容开放,而非仅支持自有生态,这才是我们认为的真正符合客户需要的国产数据化产品。数据库是需要长期持续战略投入和孵化门槛很高的产品,华为在数据库领域持续研发投入已经超过10年,金融行业和电信运营商这2个行业就是对数据库稳定可靠、性能等各方面要求极为苛刻的典型行业,有上亿用户和高并发海量交易等丰富的应用场景,这些场景的实践帮助GaussDB数据库快速孵化提升了能力,也完成了对世界*数据库的替换。”苏光牛说。

这一席话并非空谈,而是有数据作为支撑。据华为提供的数据显示,华为云数据库2019年外部收入相比2018年外部收入实现高达400%的增长,GaussDB系列数据库产品已涵盖关系型和非关系型数据库场景,广泛应用于金融、泛*、电信、能源、交通、医疗、物流、电商等行业。

数据库发展方向与趋势

过去几年,传统数据库市场份额一直在被不断冲击,而云数据库的增长潜力巨大,GaussDB数据库转向云端,就是顺应数据库云化趋势的典型案例。

对于云数据库未来发展方向,苏光牛判断,云数据库将向着云原生、分布式、多模、智能化等方向发展。而一个好的云数据库产品,至少应该具备以下几个特点:

  • 高可靠:交易型数据库的首要因素是数据库的可靠,GaussDB基于DFV的分布式存储,数据的可靠性高达11个9;
  • 高性能(支持高吞吐强一致性事务能力):如GaussDB(for MySQL)相比开源,性能从15万QPS提升到100万+级别OPS。
  • 高可用(同城双活实现集群内HA,数据不丢失,业务秒级中断;同城跨AZ容灾,数据不丢失,分钟级恢复;还有两地三中心高可用):如GaussDB(for MySQL)实现数据0丢失,故障闪恢复。
  • 高扩展(计算与存储分离弹性伸缩、容量和性能按需水平扩展):如GaussDB(for MySQL)相比开源,从1写3读提升到1写15读。
  • 高安全:用户数据上云后,数据不仅在存储层是静态加密,在计算态也是加密的。(华为全密态的黑科技揭秘发布在9月23日HC大会数据库专场session)
  • 易用性:首先要有完整的工具生态支持迁移/运维/管理无忧。面向未来,通过将AI融入到数据库内核架构和算法中,来降低云数据库的运维管理及开发调优成本,逐步实现数据库自调优、自诊断自愈、自运维能力。当前,AI参数自调优技术已经开源到openGauss社区,同时,在基于AI的SQL调优、故障诊断领域GaussDB也在重点投入,目标是最终实现数据库智能化。

GaussDB的出现,让我们看到了国内厂商实现数据库国产化的努力,从 0 到 1 是一个巨大的挑战,从 1 到高精尖,更是一个艰难的蜕变过程。希望在未来,搭乘大数据、云计算、物联网、5G通信等新技术的东风,国内厂商能够消化、吸收和借鉴国外领先的数据库技术和思想,以及自主创新的方式,让市面上出现更多符合中国人使用习惯的数据库产品!

点击阅读原文,回顾会议直播。

本文地址:https://blog.csdn.net/csdnnews/article/details/107962905