国产替代推动数据库行业发展,市场潜力巨大

发表时间: 2024-01-11 08:55

(报告出品方/作者:华创证券,吴鸣远)

一、数据库作为信息管理系统基础设施,发展进入后关系型数据库阶段

(一)数据库与数据管理系统是信息管理系统的基础软件

数据库是信息系统管理中不可或缺的核心软件。数据库是结构化信息或数据的有序集合, 一般以电子形式存储在计算机系统中。作为计算机三大基础软件(操作系统、数据库、 中间件)之一,数据库能够充分发挥硬件算力,赋能上层应用需求,是信息系统的关键 基础设施。

数据库管理系统是按照特定数据结构组织,存储和管理数据的基础软件。数据库管理 (DataBase Management System,DBMS)系统负责数据库搭建、使用和维护,对数据进 行统一控制管理,以保证数据的完整性和安全性。由外部组件集与内核组件集共同组成: 1)外部组件集:以数据库配套的独立支撑软件为主,例如数据库驱动;2)内核组件集: 一般可以分为管理组件、网络组件、计算组件、存储组件四大模块。


(二)数据库历经多年发展,迈入后关系型数据库阶段

根据信通院《2021 数据库发展研究报告》,首款企业级数据库产品诞生于上世纪 60 年代, 数据库共经历前关系型、关系型和后关系型三大阶段:

前关系型阶段(1960-1970):该阶段数据库的数据模型主要基于网状模型和层次模 型,1964 年,查尔斯·巴赫曼(Charles W. Bachman)开发了全球第一个数据库管理 系统-网状数据库管理系统(IDS),解决了层次结构无法针对复杂数据关系进行建模 的问题;1968 年,IMS(Information Management System)系统发布,这是最早商品化 的层次 DBMS。该类产品在当时较好地解决了数据集中存储和共享的问题,但在数 据抽象程度和独立性上存在明显不足。

关系型阶段(1970-2008):该阶段关系型数据库开始进行大规模应用并进入商业化阶 段。1970 年,埃德加·弗兰克·科德(Edgar Frank Codd)发表《大型共享数据库数据 的关系模型》论文,为关系型数据库技术奠定了理论基础。随后关系型数据库原型 Ingres 诞生,基于其源码开发的 SQL 经过批准、标准化后成为关系型数据库的主流 语言,在此基础上,Access、PostgreSQL 和 MySQL 等大型数据库相继发布,带动 关系型数据库不断发展、扩展应用领域。

后关系型阶段(2008-至今):该阶段数据库数据模型不断拓展,分布式架构逐渐成 熟。进入互联网 Web 2.0 和移动互联网时代,关系型数据库并不能很好地支持高并 发读写、海量数据处理、数据结构不统一等场景,NoSQL 非关系型数据库开始蓬勃 发展。

(三)根据不同分类标准,数据库可分为多种类型

数据库分类标准多样,一般包含六大分类标准。根据分类标准、应用场景的不同,不同 类别的数据库适用场景有所差异,常见的数据库分类方式如下: 按数据结构分类:传统关系型数据库、非关系型数据库(NoSQL 数据库、NewSQL 数据库、多模数据库等); 按部署模式分类:云托管数据库、云原生数据库、本地部署、混合部署; 按照商业模式分类:开源数据库、商业数据库; 按架构分类:单机式数据库、分布式数据库; 按业务负载分类:OLTP 事务型数据库、OLAP 分析型数据库、HTAP 混合型数据库; 按存储介质分类:内存数据库、硬盘数据库。

二、数据库行业发展趋势明确,国产替代成为主流

过去几年,全球数据库市场规模保持良好增长。根据 Gartner 的测算,自 2017 年起,全 球数据库市场规模保持良好增长趋势。2021 年市场规模接近 800 亿美元,同比增速超过 22%。2022 年由于疫情影响,市场规模增速为 14.4%,达到 910 亿美元。据 reporter linker 测算,全球数据库市场在 2022-2030 年期间的复合年增长率为 11.8%。其中,日本和加 拿大将分别以 8.7%和 9.6%的速度增长,德国预计将以约 9.2%的复合年增长率增长。

数据库典型行业应用特点不一。针对 IT 监管环境、数据业务复杂性、核心业务数据类型、 成本敏感性、科技能力储备情况五个维度对下游领域进行分析,各个应用领域需求强度 不同。其中,金融行业和电信行业在五个维度方面表现相同,数据库应用现状比较相似。

数据库下游领域较多,涵盖范围广。数据库下游领域涵盖范围众多,其中,金融、电信、 政务、制造、互联网五个行业为数据库产品及服务采购份额前五的行业,采购总和占据 全部市场份额的 80%以上,各代表性行业标志性案例众多。

(一)趋势一:受益于政策推进与技术进步,国产数据库进入高速发展期

1、国产数据库历经四个阶段,正处于快速发展期

术萌芽期(20 世纪 80 年代):进行理论探索与原型研究。1977 年,中国第一次数 据研讨会在黄山召开;1982 年起,萨师煊教授和王珊教授推开了中国数据库领域 的大门,设立国内第一个计算机本科专业,培养了中国数据库的第一代人才。

国外厂商垄断期(20 世纪 90 年代):国内市场被海外数据库厂商垄断。1989 年, Oracle 进入中国市场,并占据大量份额,并逐渐形成以 Oracle 为主要企业的系列 生态;1992 年,IBM 进入中国市场。同年,国内金融行业数据库被 DB2、Informix 等国外厂商数据库统领。

国产萌芽期(21 世纪初):进行原型研发与产品开发。基于海外厂商的垄断场面,国 家设立了“863”计划、“核高基重大专项”、“973”等计划,为高校的数据库研究提供 经费支持。在此期间,第一代原型数据库应运而生,包括 1999 年成立的人大金仓 (依托人大背景)、2000 年成立的武汉达梦(依托华中科大背景)、2004 年成立的 南大通用(依托南开大学背景)、2008 年成立的神舟通用(依托中国航天科技集 团)。

快速发展期(21 世纪 10 年代-今):技术不断发展与国产市场打开。在大数据与互联 网等的发展推动下,数据库市场化竞争逐渐激烈,一批新兴国产数据库厂家开始 涌现。2010 年起,阿里云开始使用开源数据库去 IOE 并提供云托管,并于 2016 年 起打造了各种云原生数据库。2012 年,腾讯云推出自主研发的分布式数据库 TDSQL,并于 2017 年推出自研云原生数据库 Cynos DB。2019 年,华为推出分布 式数据库 Gauss DB。


2、数据库利好政策频出,助力国产数据库发展

信创产业规模庞大、体系完整,是数字经济的重要抓手之一。主要涉及四大领域: 基础硬件:芯片、服务器、整机、外设设备、存储器; 基础软件:云服务、操作系统、中间件、数据库; 应用软件:办公软件、财务软件、电子签名软件、客户管理软件、工业软件; 信息安全软件:查毒软件、防火墙、入侵检测系统、入侵防御系统、安全备份系统。

政策支持信创产业发展,“自主可控”成战略级关键词。国家大力推动信创产业发展,出 台各项支持类政策。如,《“十四五”软件和信息技术服务业发展规划》(2021 年 11 月)、 《国家信息化发展战略纲要》(2016 年 7 月)等,各项整体规划中,“安全可靠”、“自主可 控”成为政策内容关键词。

推动产业自主可控,数据库作为信创产业核心基础受到各领域政策重视。2021 年 3 月, “十四五”规划纲要正式颁布,提出要培育壮大人工智能、大数据、区块链等新兴数字产 业。国家也陆续印发不同领域的“十四五”规划,数据库相关政策覆盖信息技术、金融科 技、交通物流、工业制造、知识产权等领域,共筑“十四五”数据库产业发展新格局。

3、经过多年技术研发和经验积累,国产数据库市场份额逐年提升

国产数据库持续发力,助力数据库国产化进程。21 世纪初建立的人大金仓、南大通用、 神舟通用等国产数据库厂商的不断发力,叠加大型互联网企业腾讯、阿里、华为等在数 据库领域的投入,使得国产数据库逐步打破了海外厂商的垄断局面,快速替换海外数据 库厂商的市场份额。2008 年,在面对高额的支出下,阿里巴巴率先提出“去 IOE”概念, 专注 IT 架构,并通过使用开源软件以及分布式云数据库代替 IBM 大型机、Oracle 数据 库和 EMC 存储设备。2013 年 5 月 17 日,阿里集团最后一台 IBM 小机在支付宝下线, 基本完成核心系统“去 IOE”工作,前后历时 6 年,成为中国企业界“去 IOE”的先驱。据 2022 年 Gartner 发布的数据库市场份额报告,阿里云维持 2021 年排名,位居全球第七; 华为数据库排名上升,来到第八位,腾讯维持 2021 年排名,稳居第 12 名。同时,据 2023 年智研咨询发布的报告,国产数据库企业的市场占比已从 2015 年的 10.48%提升至 2022 年的 21.30%。

4、国产数据库市场规模增量空间大,产业发展态势明晰

国产数据库市场规模有望快速攀升。据 CCSA TC601 测算,2022 年中国数据库市场规模 达 59.7 亿美元(约合 403.6 亿元人民币),预计到 2027 年,中国数据库市场总规模将达 到 1286.8 亿元,市场年复合增长率(CAGR)为 26.1%。目前国产数据库市场份额仍然较 低,未来伴随数据库市场规模逐步扩大,叠加数据库领域国产化率进度加快,国产数据 库存量增量市场有待进一步开发,市场前景可期。

国产数据库行业资本关注度较高,投融资环境较好。根据墨天轮 2023 年发布的报告, 2022 年已有 17 家国产数据库厂商和数据库生态企业获得融资,其中 2014 年后成立的新 兴企业有 12 家,占比 70.6%;单笔获得过亿元人民币融资的有 11 家,占比 64.7%。相比 于 2021 全年融资次数,数据库企业融资次数增长 21.4%。根据披露金额,2022 年融资额 度总计约为 80.92 亿元人民币。国产数据库的投资方包含高瓴、经纬、红杉等知名投资 方,投融资热度持续升温,产业发展态势逐渐明朗。

(二)趋势二:公有云数据库优势突出,国内公有云数据库市场有望高速增长

公有云模式相比本地部署模式优势突出。公有云数据库是一种基于云计算平台提供的数 据库服务,它允许用户在云端存储、管理和处理数据。公有云数据库的主要优势在于可 扩展性、灵活性、高可用性和按需付费等特点。用户无需在本地部署和维护数据库硬件 和软件,而是通过网络访问云数据库服务,从而降低了成本和管理复杂性。

公有云数据库市场规模广阔,市场份额逐渐超越本地部署。从数据库的部署模式这一子 分类来看,得益于政策红利和行业巨头的投入,过去几年中国公有云市场份额一直保持 增长趋势。根据 IDC 针对中国关系型数据库的报告,在关系型数据库中,公有云数据库 的市场份额有望从 2021 年的 55%增长至 2027 年的 73.2%,市场份额将远超私有云。伴 随未来企业数字化进程的推进,公有云数据库业务作为“基础设施”有望核心受益,向各 个行业深度应用落地,市场份额有望进一步扩大。


国内公有云数据库市场集中度更高,国产数据库处于领先地位。2022 年末,国内关系型 数据库中,在以本地部署模式进行布局的数据库厂商中,前五名厂商份额共计 53.6%,前 十名厂商份额总计 75.3%。本地部署模式中,仍有部分海外数据库厂商市场份额领先。与 本地部署市场相比,公有云数据库的市场集中度更高,前五名厂商份额共计 86.5%,前 10 名厂商份额共计 96.1%。同时,公有云数据库中国产数据库厂商份额已远超海外数据 库厂商。

(三)趋势三:全球范围内非关系型数据库数量逐步提升,非关系型创新能力不断增强

全球数据库产品数量中,非关系型数据库数量略超越关系型数据库。2022 年,全球非关 系型数据库占据市场份额的 21%,而关系型数据库则占据市场份额的 78%。尽管关系型 数据库仍占据较大市场份额,但非关系型数据库的数量已逐渐超越关系型数据库。据 CCSA TC601 统计分析,截至 2023 年 6 月,全球数据库产品共有 655 款。除了早期的两 款网状数据库和层次数据库,在剩余的 653 个数据库产品中,关系型数据库为 309 个,非关系型数据库为 344 个,占比分别为 47.3%和 52.7%。非关系型数据库中,键值型数据 库 82 个、时序数据库 53 个、图数据库 52 个,在非关系型数据库中依次占比 23.8%、 15.4%和 15.1%。

非关系型数据库研究方向成为学术领域热点。从 VLDB(International Conference on Very Large Data Bases)、SIGMOD(Special Interest Group on Management Of Data)和 ICDE (International Conference on Data Engineering)三个数据库领域权威的学术会议研究方向 看,当前关系型数据库和非关系型数据库研究内容数量占比相当,非关系型数据库研究 方向成为热点。2020-2022 年,VLDB 会议论文中关系型和非关系型数据库论文分别占三 年论文总数量的 16%和 12%;SIGMOD 会议论文中两者比例相当,均占 17%。ICDE 会 议论文中,非关系型数据库文章数超越关系型数据库文章数,分别占比 12%与 10%。

非关系型数据库适合处理非结构化数据,应用场景多样。目前对于非关系型数据库主要 有四种数据存储类型:键值对存储(key-value)、文档存储(document store)、内存数据库(in-memory database)、图形数据库(graph database)。非关系型数据库处理数据速度快、效率 高、且能够处理海量数据,并具有一定的可扩展优势,代表性数据库有 Redis、MongoDB、 Cassandra 等。

三、国产数据库有望迎来发展关键期,建议持续关注

当前信创产业快速发展,“自主可控”成为国家政策关键趋势,数据库作为核心基础,其 发展受到国家政策持续推动,国产数据库厂商有望从增量市场和存量替代两方面中受益。

达梦数据:中国电子二级单位中国软件为公司第一大股东,公司产品达梦数据库坚 持原始创新、独立研发。目前,公司已掌握数据管理与数据分析领域的核心前沿技 术,拥有主要产品全部核心源代码的自主知识产权,是国内数据库行业的领先企业, 在本轮信创国产替代潮流中有望受益。

太极股份:由国资委控股,旗下人大金仓数据库以数据存储计算为核心,提供稳定 卓越的产品体系,自主研发推出通用型数据库 KingbaseES、分析型数据库 KingbaseAnalyticsDB、分布式数据库 KSOne,面向不同场景提供服务,有望在此轮 国产替代政策下受益。

航天软件:由中国航天科技集团有限公司控股,旗下神通数据库拥有自主知识产权, 可以处理海量企业级数据。由于融入多项数据加密技术,支持异地容灾、故障秒级 切换,神通数据库安全系数高,广泛应用于军工、航天领域。

海量数据:秉承“专注做好数据库”的初心,专注于数据库产品研发、销售和服务。 经过多年自主研发,已经形成“一核两翼”布局,数据库作为其业务核心,先后推出 Vastbase E100、Vastbase G100 和 Vastbase M100 数据库。

星环科技:公司打造一系列高性能国产数据库产品,覆盖 10 条数据库赛道,包括关 系型数据库(ArgoDB、KunDB)、图数据库(StellarDB)、文档数据库(DocStore), 时序数据库(Timelyre)等,围绕数据的集成、存储、治理、建模、分析、挖掘和流 通等数据全生命周期提供基础软件及服务。

中亦科技:主营业务专注于 IT 基础架构层。旗下 EVO-DBaaS 亦维数据库自动化运 维平台纳管 Oracle、MySQL、MongoDB、达梦、openGauss、人大金仓等数据库, 有望借助数据库厂商发展势头受益。

创意信息:基于大数据、数据库和 5G 三大核心技术能力,构建起从感知层、网络 层、平台层到应用层的全栈自主可控技术、产品和解决方案。其中数据库产品主要 包括单机数据库、集中式数据库、分布式数据库、目录服务系统数据库等。

英方软件:依托自主研发的动态文件字节级复制、数据库语义级复制和卷层块级复 制三大核心底层复制技术及其他信息化技术,公司构造了“容灾+备份+云灾备+大数 据”四大数据复制产品系列,在企业业务连续性及数据复制管理领域处于领先地位。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告来源:【未来智库】。「链接」