国产开源数据库云原生时代崛起

发表时间: 2022-02-28 10:31

对于国产开源数据库而言,现在是最好的一个时代,也是最具挑战性的一个时代。

盘点近年来基础软件最火热的赛道,数据库无疑是其中较为热门的领域。据 36 氪统计,这两年间,获得融资的国产数据库公司超过 37 家,2021 年获得新一轮融资的企业多达 20 家。

其中,企业背后的投资方阵容堪称豪华,不乏红杉中国、高瓴资本、经纬创投、云启资本等知名投资机构,同时腾讯、阿里等互联网巨头也纷纷入局,可谓热闹非凡。

不过, 21 世纪初始,国产数据库产业的发展还相对缓慢,甚至被认为是盐碱地,这片土地上仅存的养分全被早在1970年就发展起来的海外数据库厂商们汲取,本土难以孕育出耀眼的新星。但随着资本与市场沃土的培育,一个新兴的产业在这个时代快速崛起,并逐渐占领本土市场,开始走向海外。

01国产开源数据库,正在攀越大山,迎来春天

2014年之前,鏖战国内众多数据库当中,Oracle (甲骨文)是首当屈指的老大,紧跟其后的是 IBM 和微软。这三座大山一直萦绕在国内数据库的发展历程中。

不过,伴随着一纸“禁令”的出现,国内绝大多数的科技企业都在追随国产替代的脚步,并涌逐渐现出一股国产数据库迭代潮。

与此同时,中国互联网的飞速发展和业务多样化,猛增海量数据量,传统的数据库已无法满足当下需求的高并发,且海外领头数据库厂商带来的高昂IT运维支出也令人瞠目结舌。

在此背景之下,本土市场的开发者们看到了这样一个机会:中国亟需诞生出自研的新兴数据库,突破”卡脖子“技术,占领数据库市场,吃上数据库生态的这块蛋糕。

于是乎,在政策的利好、需求的拉动和供应链厂商的联合之下,我国数据库市场迎来百花齐放的春天。2017 年,从 Gartner 的数据库系列报告中,我们首次看到了国产数据库的身影。另外,据艾瑞统计, 2020 年中国数据库市场总规模达 247.1 亿元,同比增长 16.2% ,其中, 2020 至 2022 年,中国数据库市场预计呈高增长的态势。

百家争鸣之际,痛点与难点也随之而来。在这个风起云涌,国产替代迅速崛起的时代,通用数据库的标准、规范却掌握在海外巨头手中,国内数据库大多又以闭源为主,业界数据库生态难以一统。

那么,有什么方式可以构建国产自研数据库生态、加速数据库技术迭代呢?

我们来看有一组数据:截至 2021 年 1 月,开源数据库的全球部署首次超过了商业数据库。由此可以看出,全球主流的数据库以开源居多。那么,若是要构建国产自研数据库生态、加速技术迭代、令国内数据库走向国际,开源似乎是一个可尝试的好办法。

而且就在去年 3 月,开源还被正式列入“十四五”规划发展纲要当中,这彰显着未来开源将成为数字创新技术和数字经济的重要支撑力量,国产开源数据库又将迎来一个新春天。

02”东数西算“之下,这些国产开源数据库战斗在云时代

日前,国家多个部门联合印发了《全国一体化大数据中心协同创新体系算力枢纽实施方案》,同意在京津冀、长三角、粤港澳大湾区、成渝等 8 地启动建设国家算力枢纽节点,并规划了 10 个国家数据中心集群。

至此,全国一体化大数据中心体系完成总体布局设计,“东数西算” 的中国巨大工程全面启动。

在数字经济愈发重要的当下,国产开源数据库走向又一个春日的今天,这些战斗在云原生时代的国产开源数据库是以怎样的姿态构建新的生态环境的呢?所有的一切都得从项目本身说起,让我们一起来学习一下这些热门的优质国产开源数据库。

TiDB

开源许可证:Apache-2.0

项目作者:PingCAP

项目地址:https://gitee.com/pingcap/tidb

项目简介:

TiDB 是由 PingCAP 公司自主设计、研发新一代数据库,早在 2015 年便已开源。它是一款同时支持在线事务处理与在线分析处理 (Hybrid Transactional and Analytical Processing, HTAP) 的融合型分布式数据库产品。

架构展示:

OceanBase

开源许可证:MulanPubL-2.0

项目作者:OceanBase

项目地址:https://gitee.com/oceanbase/oceanbase

项目简介:

OceanBase 是一个金融级原生的分布式关系数据库,始创于 2010 年,并于 2021 年 6 月正式开源。它具有数据强一致、高可用、高性能、在线扩展、高度兼容 SQL 标准和主流关系数据库、低成本等特点。

架构展示:

PolarDB

开源许可证:Apache-2.0

项目作者:阿里巴巴

项目地址:https://gitee.com/mirrors_alibaba/PolarDB-for-PostgreSQL

项目简介:

PolarDB 是阿里云自研的云原生关系型开源数据库,采用的是分布式共享存储(存储与计算分离)架构。

架构展示:

OpenMLDB

开源许可证:Apache-2.0

项目作者:第四范式

项目地址:https://gitee.com/paradigm4/OpenMLDB

项目简介:

OpenMLDB 是一个开源机器学习数据库,提供生产级数据及特征开发全栈 FeatureOps 解决方案。

架构展示:

openGauss-server

开源许可证:MulanPSL-2.0

项目作者:openGauss

项目地址:https://gitee.com/opengauss/openGauss-server

项目简介:

openGauss 是一款开源的关系型数据库管理系统,它具有多核高性能、全链路安全性、智能运维等企业级特性。

架构展示:

TDengine

开源许可证:AGPL-3.0

项目作者:TDengine

项目地址:https://gitee.com/taosdata/TDengine

项目简介:

TDengine 是涛思数据专为物联网、车联网、工业互联网、 IT 运维等设计和优化的一款高性能、分布式、支持 SQL 的时序数据库,其核心代码包括集群功能全部开源。

体验代码:

在 TDengine 终端中,用户可以通过 SQL 命令来创建/删除数据库、表等,并进行插入查询操作。

create database demo;use demo;create table t (ts timestamp, speed int);insert into t values ('2019-07-15 00:00:00', 10);insert into t values ('2019-07-15 01:00:00', 20);select * from t;          ts          |   speed   |=================================== 19-07-15 00:00:00.000|         10| 19-07-15 01:00:00.000|         20|Query OK, 2 row(s) in set (0.001700s)

Nebula

开源许可证:Apache-2.0

项目作者:vesoft-inc

项目地址:https://gitee.com/vesoft-inc/Nebula

项目简介:

Nebula 是一个分布式、可扩展的开源图数据库,擅长处理千亿个顶点和万亿条边的超大规模数据集,公司创始团队来自于 Facebook、阿里巴巴、华为等国内外各大知名公司。

产品架构:

gStore

开源许可证:BSD-3-Clause

项目作者:PKUMsOD

项目地址:https://gitee.com/PKUMOD/gStore

项目简介:

gStore 是一种原生基于图数据模型( Native Graph Model)的 RDF 数据管理系统,由邹磊教授领导的北京大学王选计算机所数据管理实验室( PKUMOD )研发。

产品架构:

matrixone

开源许可证:Apache-2.0

项目作者:matrixorigin

项目地址:https://gitee.com/matrixorigin/matrixone

项目简介:

MatrixOne 是一个分布式的云原生融合数据库,专为异构混合工作负载而设计。

架构展示:

说在最后

在开往未来的这趟国产数据库列车里,诞生了许多优秀且创新的开源数据库项目。如今,新一代的科技革命与产业革新已经到来,在这个复杂的科技赛道上,接下来应该怎么走,谁都没有一个准确的答案。

国产数据库究竟能走多远?与国外的先进产品的差距是拉大还是缩小?这些都是未知数。

不过如今我们能明确的是:如果能够构建一个良好的数据库生态,给予国产替代一个健康向前的市场环境,那么在这个激荡的时代一定可以创建出只属于我们的道路。