分布式数据库淘汰赛:从“能用”到“好用”的制胜关键是什么?

发表时间: 2024-01-04 15:48

时间已经悄然来到了2024年,如果说当下国产数据库市场已经进入到“战国”时代,那么分布式交易型数据库无疑是“各国”最锋利的“武器”。国产数据库公司GBASE南大通用早在2012年就开始在这个方向进行布局,于2020年打磨出了分布式交易型数据库GBase 8c,并在2022年完成了产品升级。GBase 8c的面市完善了其产品拼图,如今GBase 8c与GBase 8a、GBase 8s共同构成了该公司的三款主导产品。

“GBase 8c的目标是做到行业前三。”GBASE南大通用GBase 8c产品总经理张益说。在竞争激烈的分布式数据库市场,GBase 8c的底气何在?未来分布式数据库制胜的关键是什么?

厚积薄发,志在行业前三

GBase 8c定位为一款多模多态分布式关系型数据库,支持HTAP混合负载。多模是指GBase 8c包含了行存、列存、内存多种存储模式。多态是指GBase 8c支持单机、主备式、分布式多种部署形态,可以满足业务多样性需求。

提起南大通用,大家更为熟悉的是其分析型数据库GBase 8a和集中式数据库GBase 8s,而GBase 8c对公司同样具有重要战略意义。GBase 8c推出后补全了该公司在关系型数据库领域的拼图,实现了关系型数据库领域AP、TP、HTAP、集中式、分布式的全面覆盖,使南大通用成为了真正的全栈数据库产品公司。

据悉,自推出后一年多的时间里,GBase 8c在市场上不断开花结果,成为GBASE又一拳头产品。目前,GBase 8c服务了金融、电信、能源、医疗等多个行业,部署节点数超过2000个。

张益介绍,GBase 8c能如此快速发展是顺势而为、厚积薄发的结果。

一方面,市场有广泛的需求。如在关键核心业务场景,随着关键核心业务量不断增长,传统的集中式数据库对高并发、高吞吐量的需求支持能力不足,分布式数据库成为解决这一问题的有力武器。互联网业务的大促、秒杀等海量数据并发场景,对弹性、自动伸缩有较高的需求,以及政企业务及IT基础设施国产化,都是对分布式数据库有巨大需求的场景。此外,能够带来实时洞察的实时分析也是很多的业务的刚需,这些需要数据库具备HTAP能力。

GBase 8c的多模多态能力满足了用户的需求,为用户带来了非常大的价值。比如,支持行存、列存和内存三种存储模式使得GBase 8c具备了一专多能的能力,能够很好地支持HTAP混合负载。在刚刚结束的openGauss Summit 2023峰会上,GBase 8c又增加了对向量存储引擎的支持,为海量非结构化数据处理以及AI/大模型的发展提供有力支撑。现在通过行存、列存、内存三种存储模式,GBase 8c能够满足大部分业务场景的需求。而支持单机、主备式、分布式多种部署形态,GBase 8c实现一套数据库满足用户业务发展不同阶段的需求。如在业务初期,企业可以选择单机或者主备部署,随着业务增长,可以平滑切换到分布式模式,不需要再做应用改造,这样可以降低系统初期建设成本和整个系统的总体拥有成本。

张益强调,南大通用在分布式交易型数据库方面是厚积薄发,有很长时间的积累。早在2012年南大通用就开始涉足分布式交易型数据库领域,由于看好国内自主可控的根社区openGauss,2021年南大通用加入了openGauss社区,2022年基于openGauss推出了升级版的GBase 8c。据悉,GBase 8c基于openGauss,在内核层面做了重构改造,采用存算分离架构,支持动态扩缩容,实现了强一致性分布式事务,99.999%高可用,兼容PG、Oracle、MySQL主流数据库,从内核到工具全栈兼容国产化生态。

GBase 8c架构

刚刚过去的2023年,GBase 8c在金融、电信、医疗、交通等行业都有了落地和突破,实现了10倍增长,验证了其具备大规模商业化的能力。张益对未来充满期待,“GBase 8c的目标是做到行业前三。”

“能用”到“好用”是分布式数据库制胜关键

近些年,伴随着国产化浪潮,分布式数据库的应用越来越深入,从外围系统延展到核心业务系统,对数据库能力的要求也越来越高。

张益介绍,用户在进行分布式数据库选型时会关注以下几个方面,一是,稳定性。不希望出任何问题;二是,性能。满足业务的需求;三是,对Oracle、MySQL等主流数据库的兼容性,改造成本要低。一般业务系统和核心业务系统的侧重点会有不同,一般业务系统可能会把主流数据库的兼容性放在首位,更关注替换成本,而核心业务系统,稳定性永远是第一位的。

不同业务在使用分布式数据库时也会有不同的策略。据张益观察,一般业务系统的要求没有核心系统高,通常要求快速替换,尽可能追求平替。甚至有的应用开发商已经找不到,也无法做升级改造。

核心系统有新核心建设和旧有核心系统替换两种。不少用户将分布式数据库用于建设新核心系统,这种情况并不涉及系统改造和应用迁移,用户在数据库选型后,会进行试生产,为了稳妥起见,通常会做3-5倍系统峰值的长时间压测。而如果是旧有核心系统替换,会涉及业务系统的改造和迁移,通常会有一段时间旧系统和新系统双库并跑,等新系统运行稳定后,再慢慢将旧系统下线。

2023年,包括金融行业在内的数据库国产化迁移正在从边缘系统向核心系统攻坚,分布式数据库走入了深水区。用户对数据库的追求由“能用”转变为“好用”,从“能用”到“好用”是分布式数据库的一道坎,能否迈过这道坎是未来制胜的关键。

张益指出,一款“好用”的分布式数据库需要坚持以产品为中心,从广泛的真实场景中磨练出来。比如,在进行国产化替代的过程中难免出现问题,如果出现了问题,尽量通过产品、研发体系来解决,南大通用认为标准化的研发流程和产品质量管理体系才是一家软件企业立足的根本。

此外,分布式数据库整体还面临着人才短缺、生态不足的短板,这是每种新的技术产品在走向成熟时都会经历的一个阶段,人才培养和生态建设是一个慢功夫,需要产学研用共同努力才能有效解决这些问题。

整体上,市场对分布式数据库有广泛的需求,近几年越来越多的分布式数据库在核心系统投产也验证了其能力,未来可期。海阔凭鱼跃,天高任鸟飞。期待GBase 8c在未来能有好的表现。