数据库行业现状深度解析:竞争态势与发展趋势展望

发表时间: 2024-09-09 08:55

(报告出品方/作者:中泰证券,闻学臣、苏仪、王雪晴)

数据库:管理数据资源的基础软件

数据库系统:数据、管理/应用软件与终端用户的统称

数据库(Database,DB)数据库是结构化信息或数据的有序集合,一般以电子形式存储在计算机系统中。由数据库 管理系统(Database Management System,DBMS)控制。DBMS能够与最终用户、应用程序和数据库本身进行交互 以捕获和分析数据。广义上可将数据、数据库管理系统、应用软件以及对应的普通用户和管理用户统称为数据库系统 (Database System,DBS)。

数据库软件的定位:计算机系统的核心基础软件

数据库作为沟通企业应用软件和底层存储计算资源的纽带: 数据库为上层应用提供高效的数据管理和操作功能。数据库提供了易于使用的接口和查询语言,使得应用程序可以轻松 地与数据库进行交互。通过数据库连接,上层应用可以实现数据的存储、查询、更新、检索和删除工作,满足应用程序 对数据的需求。数据库为底层基础资源提供统一的数据访问接口。通过连接底层基础资源,数据库能够直接与存储设备、 网络通信和系统资源进行交互。这种连接能力使得数据库能够有效地管理数据的物理存储,实现数据的持久性和可靠性, 同时也为应用程序提供了高度的可扩展性和可定制性。

前关系型阶段(1960-1970):网状、层次数据库出现

为解决“阿波罗登月”计划处理庞大数据量的需求,北美航空公司(NAA)开发出 GUAM(Generalized Update Access Method)软件。其设计思想是将多个小组件构成较大组件,最终组成完整产品。这是一种倒置树的结构,也被称之为层 次结构。随后 IBM 加入 NAA,将 GUAM 发展成为 IMS(Information Management System)系统并发布于 1968 年,成 为最早商品化的层次 DBMS。 1963 年,通用电气公司的 Charles Bachman 等人开发出世界上第一个数据库管理系统(以下简称 DBMS)也是第一个 网状 DBMS——集成数据存储(Integrated Data Store,IDS)。

关系型数据库阶段(1970-2008):SQL成为主流语言,RDB大规模应用

1974年,Ingres原型诞生,为后续大量基于其源码开发的PostgreSQL、Sybase、Informix和Tandem等著名产品打下坚 实基础。1977年,Oracle前身SDL成立。1978年,SDL发布Oracle第一个版本。 20世纪80年代,关系型数据库进入商业化时代。1980年,关系型数据库公司RTI成立并销售Ingres。1983年,IBM发布 Database2(DB2) for MVS,标志DB2正式诞生。1984年,Sybase公司成立。1985年,Informix发布第一款产品。1986年, 美国国家标准局(ANSI)数据库委员会批准SQL作为数据库语言的美国标准并公布标准SQL文本。 1987年,国际标准化组织(ISO)也做出了同样决定,对SQL进行标准化规范并不断更新,使得SQL成为关系型数据库的 主流语言。 20 世纪 90 年代,Access、PostgreSQL 和 MySQL 相继发布。关系型数据库理论得到了充分的完善、扩 展和应用。

根据数据模型分类:关系型Vs非关系型

关系型数据库(Relational Database,RDB)以预定义的关系组织数据,将数据存储在一个或多个由列和行构成的表 (tables)中,表之间通过特定的关系相互连接。截止2024年6月,全球关系型数据库共有330款,占比46%。 非关系型数据库(Not Only SQL,NoSQL)与传统的关系型数据库不同,数据库不使用固定的表结构、主键和外键关 系,而是提供更灵活的数据模型以适应不同的应用场景。其类型包括文档数据库(Document Store)、键值数据库 (Key-Value Store)、列族数据库(Column Family Store)、图数据库(Graph Database)等。截止2024年6月,全 球非关系型数据库产品共有383款,占比54%。

数据库正走向云原生:存算分离+多模数据正成为数据库系统设计的趋势

云原生正在成为数据库系统设计的趋势,能够充分利用云平台的池化资源,适应云平台的基础设施。与传统数据中心 采用的物理服务器、物理网络、物理存储设施不同,云计算环境下普遍采用基于容器化、微服务、Serverless 等理念进 行基础设施的架构,以云化运行环境为前提,在设计上通常结合分布式技术并普遍采用计算——存储分离、日志即数据 的设计思想,能够灵活调动资源进行扩缩容,可进一步实现资源池化、弹性变配、集约运维等能力,以应对更便捷、更 低门槛实现云上数字化转型与升级的挑战。

数据湖:大数据时代的又一存储选择,湖仓一体或成未来趋势

数据湖可存储结构化和非结构化数据,是一种面向大规模、多来源、高度多样化数据的组织方法。数据湖将数据管理的 流程简化为数据入湖和数据分析两个阶段,能够支持各种类型数据的统一存储。数据分析则以读取型(schema on read) 形式,极大提升分析效率。 湖仓一体技术或成为未来普遍应用的数据治理架构。通过融合数据湖与数据仓库的优势,可以形成一体化、开放式数据 处理平台,使得数据处理平台底层支持多数据类型统一存储,实现数据在数据湖、数据仓库之间无缝调度和管理,并使 得上层通过统一接口进行访问查询和分析。

数据库产品百花齐放, 国产替代正当时

数据规模快速增长,价值与日俱增

根据艾瑞咨询的报告显示,到2035年,全球生产和存储的数据总量将达到2142ZB(泽字节),涵盖交通、零售、工业、 教育、卫生、政务等社会经济各个领域。 我国数据资源总量快速提升,对数据资源的管理需求将会不断增长。全国 2023 年数据生产总量达到 32.85 泽字节 (ZB),约相当于 1000 多万个中国国家图书馆的数字资源总量。预计到2025年中国数据总量预计将跃居全球第一, 占比有望达到27%以上。

全球视角:流行程度-国外数据库受追捧,关系型数据库占主导地位

根据DB-engines的数据显示,Oracle、MySQL、 Microsoft SQL Server深受欢迎,稳居前三。关系模型占主导地位。从数据库结构来看,关 系模型因其特有的原子性、一致性、隔离性和 持久性优势,成为了当代主流的数据模型。多模数据库成为新趋势。随着业务的多样化, 应用对于数据的多类型处理能力提出了更高的 要求。从表格中可以看到,主流数据库系统打 上了Multi-model的能力标签。

国内视角:国内数据库产品类型以关系型为主

我国数据库产品数量呈现以关系型为主,非关系 型数据库为辅的局面。 依据CCSA TC601的数据显示,截止至2023年 6月,国内的关系型数据库 156 个,非关系型 数据库有 82 个,占比分别为 65.5%和 34.5%。 在国内的非关系型数据库市场中,图数据库和 时序数据库各有24个产品,分别占据了29.3% 的市场份额。键值数据库和列存数据库各有10 个产品,各自占据市场份额的12.2%。

信创:作为核心系统,央国企必须于2027年完成国产替代

国产信创替代正在走向行业阶段。十四五”规划中明确指出到2025年行政办公及电子政务系统要全部完成国产化替代。 2022年9月,国资委发布79号文提到要求国央企落实信息化系统的信创国产化改造,要求央企、国企、地方国企全面落 实信创国产化,并要求2027年全部完成国产化替代。目前国产替代最领先的为金融领域;从下游行业分布来看,金融 行业占比最大(约为46%),其次为政府、电信、互联网等行业。

国产数据库企业的破局之道:借助开源技术快速开发迭代

我国有超70种数据库产品是基于开源数据库开发的。起源数据库最多的前三名分别是 OpenGauss(占比 22.1%)、 PostgreSQL(占比 20.8%)和 MySQL(占比 13.0%)。国产数据库产业在开源项目的基础上进行了广泛的创新和自 主研发,形成了多样化的产品生态。

国内外数据库厂商蓬勃发展

海外厂商:Oracle-全球数据库管理龙头企业

Oracle公司是全球数据库管理龙头企业。Oracle以数据库业务起家,通过不断的战略收购,逐渐发展为提供全面解决 方案的全球领先的信息管理软件及服务厂商,公司在1986年成功在纳斯达克上市,目前已拥有超40万客户。 Oracle数据库自最初的V2版到至今的23ai版,产品持续进行创新和升级。Oracle Database 23ai推出的新功能AI Vector Search, 使新的和现有的应用能够以语义方式搜索数据,并将数据的含义与数据库中已存储的业务数据相结合。 公司FY2024收入高达530亿美元,同比增速达6%;公司拥有15.9万员工,为全球客户服务。

海外厂商:IBM-关系型数据库领航者

关系型数据库领航者。IBM成立于1911年,是全球最大的信息技术和业务解决方案公司。1970年,IBM实验室的 EdgarFrankCodd发表了一篇题为《大型共享数据库数据的关系模型》论文,为关系型数据库技术奠定了理论基础;1973年, IBM启动验证关系型数据库系统的项目System R;1983年发布商业版数据库 DB2。 IBM Db2 是一种云原生数据库,基于数十年的专业知识构建,为客户的任务关键型数据、分析和 AI 驱动应用程序及操作带来 数据治理与安全性、低延迟事务和连续可用性。 Db2支持大规模的事务和分析工作负载,提供了保持应用程序运行、存储和查 询任何内容并简化开发的单一平台。 Db2 11.5提供Db2 Community Edition、Db2 Community Edition、Db2 Advanced Edition三种版本,面向不同客户以及开发人 员和合作伙伴社区。

国内厂商:华为-云数据库GaussDB

GaussDB适用于大并发、大数据量、以联机事务处理为主的交易型应用,同时具备PB级数据负载能力,适用于安全、 电信、金融、物联网等行业的详单查询业务。 基于20余年战略投入、软硬全栈协同所研发, GaussDB具备高安全、高性能、高可用、高弹性以及高智能等技术特点。

国内厂商:星环科技-企业级大数据基础软件开发商

公司在基础软件产品领域积累多年,采用新一代的分布式技术,自主研发了分布式分析型数据库 ArgoDB 和分布式交 易型数据库 KunDB。KunDB与ArgoDB均是面向云原生架构设计的新一代数据库,根据工信部电子第五研究所代码扫 描测试报告,ArgoDB代码自主率(行数)超过90%。ArgoDB和KunDB在银行、运营商、能源等行业领域均有落地案例,公司持续通过市场拓展形成了广泛的客户基础。

国内厂商:PingCAP-分布式关系型数据库 TiDB

PingCAP 成立于 2015 年,是一家企业级开源分布式数据库厂商。PingCAP 公司自主设计、研发的开源分布式关系型 数据库TiDB是一款同时支持在线事务处理与在线分析处理 (HTAP) 的融合型分布式数据库产品,具备水平扩容或者缩 容、金融级高可用、实时 HTAP、云原生的分布式数据库、兼容 MySQL 协议和 MySQL 生态等重要特性。

报告节选:


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告来源:【未来智库】。未来智库 - 官方网站