国产数据库的崛起:深度解析数据库行业需求

发表时间: 2023-12-09 22:36

数据库市场规模高增,国产化持续推进。根据大数据技术标准推进委员会,2022年我国数据库市场规模(包含数据库周边生态)占全球7.2%,约合403.6亿元人民币。预计到2027年,我国数据库市场总规模将达到1286.8亿元,市场年复合增长率为26.1%。据墨天轮
DB2等海外数据库仍占据相当份额。调查统计,超八成被调查者所在企业正在使用国产数据库产品,数据库国产化程度持续提高,代表厂商包括华为云GaussDB、阿里云PolarDB、蚂蚁OceanBase、TiDB、腾讯云TDSQL、人大金仓以及南大通用等,但同时Oracle、微软SQL Server、IBM


从产品类型角度看,在国产替代及大数据应用需求推动下,新兴数据库类型蓬勃发展。分数据模型看,目前我国数据库产品中,关系型数据库为156个,占比65.5%。但非关系型数据库创新活跃,随着数据类型持续变得繁多且分散,非关系型数据库需求逐步增加。分设计架构看,集中式数据库市场份额仍占据约80%,但分布式数据库规模自2019年以来已增加11倍,随着数据处理能力、高并发、高可用等需求提升,分布式架构市场规模高速发展,且已开始替换核心业务系统。分部署模式看,国内公有云部署数据库占比已超过本地部署数据库。分业务负载看,随着大数据应用分析需求提升,分析型数据库需求高增,结合事务与分析场景的HTAP数据库正成为我国数据库创新发展的一大趋势。

分下游客户行业看:金融行业数字化进程推动创新型业务发展,虽然传统核心系统仍搭建在传统集中关系型数据库上,但已有包括五大行在内的部分金融机构开始应用国产分布式数据库,且已有核心业务系统替换案例。电信行业集中式数据库仍占主导地位,近期运营商数据库信创招标提速将提升行业数据库国产化率。政府业务方面,数字政府建设背景下大数据管理平台需求提升。根据IDC分析,2022年我国数字政府一体化大数据管理平台规模达59.1亿元人民币,增长率为19.2%,呈现稳健增长态势,持续提升的政府数据应用推动背后数据库基础设施需求提升。互联网行业中云原生和分布式数据库已成为行业主流,根据Forrester Consulting调研,有62%的受访者已经使用云上云原生关系型数据库以及分布式关系型数据库,大幅领先于传统关系型数据库。制造业存在数据库创新需求,目前工业领域数据量激增,数据库需求大,已有30多款时序数据库产品在新能源发电、储能智慧运维等场景中落地应用。能源行业数据库国产化替代已深入核心系统,国家电网、中国华能集团、中国华电集团、中石油、中海油、中广核等大型能源企业均已采用国产数据库产品。

风险提示:技术发展不及预期;政策落地不及预期;行业竞争加剧风险。


一、国内数据库市场空间及行业格局

根据大数据技术标准推进委员会,2022年全球数据库市场规模为833亿美元,我国数据库市场规模(包含数据库服务、安全等周边生态)为59.7亿美元(约合403.6亿元人民币),占全球7.2%。预计到2027年,我国数据库市场总规模将达到1286.8亿元,市场年复合增长率(CAGR)为26.1%。其中,IDC统计2022年国内关系型数据库市场规模为34.3亿美元,同比增长23.9%;按照历史关系/非关系数据库比例推算,2022年整体国内数据库产品市场规模约为40亿美元。

数据库可按数据模型、设计架构、部署模式和业务负载特征进行分类。1)按数据模型:分为关系型数据库、非关系型数据库(NoSQL);2)按设计架构:分为集中式数据库、分布式数据库;3)按部署模式:分为本地数据库和云数据库;4)按业务负载特征:分为OLTP数据库、OLAP数据库和HTAP数据库。

1、关系VS非关系:关系型仍为主流,非关系型蓬勃发展

关系型数据库仍为主流数据库类型。根据大数据技术标准推进委员会统计,目前我国数据库产品中,关系型数据库为156个,占比65.5%。非关系型数据库中种类繁多,其中键值数据库以24%占比位列第一,图数据库/文档数据库/时序数据库以15%占比位列第二,全文搜索数据库以8%占比位列第三。

我国关系型数据库规模持续增长,未来空间广阔。根据IDC显示,2022年我国关系型数据库软件市场规模为34.3亿美元,同比增长23.9%;预测到2027年,我国关系型数据库软件市场规模将达到102.7亿美元,2022-2027的5年市场年复合增长率(CAGR)为24.5%。

我国本土关系型数据库已崛起。国产关系型数据库产品已越来越广泛地被使用到关键行业和企业核心系统中替换其它存量数据库,华为、腾讯、人大金仓、阿里云等本土数据库品牌占关系型数据库市场份额已较大,尤其在公有云部署数据库领域优势显著。

非关系型数据库适合处理大规模的非结构化数据。非关系型数据库通常分为四个类别:键值数据库、列式数据库、文档型数据库和图数据库,目前最流行的非关系型数据库包括MongoDB、Cassandra、Redis 等等,广泛应用于大数据、云计算、物联网、移动应用等领域。

2、集中VS分布:集中式超八成,分布式应用持续增加

我国数据库市场整体以传统集中式数据库为主,占比超80%。根据艾瑞咨询统计,我国集中式数据库市场份额仍占据约80%,分布式数据库部署占约20%。虽然分布式数据库现阶段占比较低,但随着未来市场对快速增长的海量数据处理能力、高并发处理能力、动态拓展能力以及多副本高可用等方面的需求,分布式数据库的规模自2019年以来也在逐年增加,截止至2022年11月,国产分布式数据库规模已达到2019年规模的11倍。

分布式数据库的运用场景依旧以非核心业务为主,绝大部分核心领域依然依赖集中式数据库。传统集中式数据库具有简单易用的优点,可满足绝大多数行业与业务场景中的数据处理需求,尤其在小规模数据量的场景中,集中式数据库表现优异。分布式数据库因其分布架构的特殊性,可以承载更大规模的数据量,随着近年来企业数字化转型的不断深入,各类应用场景对数据库的高并发处理能力、可扩展性等方面有了更高的需求,而信创环境下的国产替代趋势也将对国产分布式数据库的需求使用增加助力。

3、云VS本地:公有云数据库市场高速增长

数据库可按部署方式分为公有云与本地部署,根据大数据技术标准推进委员会测算,2021-2023年间我国公有云市场规模增速明显高于本地部署,预计2023年公有云数据库与本地部署数据库在我国的市场规模分别为323.16亿元与217.24亿元。


云数据库相比传统数据库,在成本、易用性、可用性、可调节性、可扩展性与并行处理能力等多个方面均有明显优势,均得益于云计算特有的“资源池化”特点。相比于传统集中式数据库对硬件设备的高要求与维护修复时的高难度,云数据库使用户可以根据实际应用情况灵活调整,也无需额外购买基础软硬件设施,亦不需要专业人员(DBA)的部署,在使用与维护层面上节省了人工与物力,同时,由于大多数云数据库都支持热备架构,故有更高的容灾性,可以实现故障秒级自动切换,使备份与恢复动作更加快捷便利。但由于,在现阶段中,云产品的发展尚未达到高度成熟,云环境尚未发展完全,以及市场对混合部署的需求的清晰程度不够高,使现在云数据库在性能优化、数据质量、数据迁移、数据融合与操作应用规范标准方面仍有进步空间。

现阶段云数据库主要包括两种:一种是托管在云厂商上的“传统”数据库,例如MongoDB、Redis等都可以进行云托管;另一种是基于云环境的云原生数据库,例如阿里云的PolarDB等,华为的GaussDB,腾讯的TDSQL等。

4、事务VS分析:大数据应用带来分析型数据库需求提升

OLAP与OLTP系统作用于存储和处理大量数据系统,其功能存在较大差异。OLAP(联机分析处理系统)主要应用于分析聚合数据,而OLTP(联机事务处理 系统)一般是处理数据库事务;在数据架构上,OLAP优先数据读取后写入操作,而OLTP优先数据读写;在性能上,OLAP处理时长为几分钟到几小时不等,而OLTP为毫秒或更短。

基于不同数据库的不同特性,他们有着不一样的应用场景:

OLTP数据库,或联机事务处理数据库,是一种专注于支持高度交互性、实时性和高并发性能的数据库类型。它在各种行业中被广泛应用,以满足日常业务需求。大多数企业级数据库产品,例如Oracle Database、Microsoft SQL Server、Gauss100、OceanBase都以支持OLTP为主要关注点。它们提供了强大的事务处理功能,支持ACID(原子性、一致性、隔离性和持久性)事务,以确保数据的完整性和一致性。这些数据库系统在金融、电子商务、零售、电信、医疗保健、制造业等各种行业中广泛应用,因为它们能够满足高度交互性、高并发性能和实时事务处理的要求。

综合来说,OLTP数据库适用于需要处理日常事务和保证数据的实时一致性的场景,如订单处理、交易记录、库存管理;而OLAP数据库适用于需要进行深入数据分析和决策支持的场景。

OLAP数据库,或联机分析处理数据库,是一类专门设计用于支持复杂数据分析和决策支持的数据库系统。OLAP数据库的主要特点在于其数据存储和查询结构,使得用户能够进行多维度、交互性的数据分析,探索大规模数据集中的模式、趋势和关联关系。

HTAP同时支撑OLTP和OLAP场景,在大数据需求下,快速完成多次技术革新。HTAP(混合事务分析处理)数据库也在大数据需求的背景下不断发展与推进,其交易分析一体化的特点能够支撑多类业务。HTAP同时支持OLTP和OLAP场景,旨在大数据背景下,实现多数据处理,达成用户对更大数据量、更低延迟、更高系统弹性与效率且更低成本的需求。预计在未来,HTAP提供的在处理大数据的同时提供秒级实时交易与查询体验的数据库将会成为大数据背景下的一大趋势。然而,目前国内厂商还未在HTAP数据库方面实现高百分比的国产替代,技术框架搭建还未成熟;在技术实现方面,HTAP在数据组织、数据同步、查询优化和资源调度等方面仍需持续突破。HTAP数据库在未来在我国数据库市场中还有很大的市场潜力与市场空间。

据墨天轮发布的2023年我国数据库排行榜,其中共有260个我国数据库参与排名,在162个关系型数据库中,HTAP数据库占比16%,共26个。数据库排行榜中拔得头筹的OceanBase、TiDB、openGauss 均有涉足HTAP领域,由此可见HTAP的概念正吸引着国内头部数据库厂商不断深入探究,是我国数据库创新发展的一大趋势。

技术方面,HTAP的关键技术主要体现在数据组织技术、同步技术、查询优化技术、资源调度技术。在大数据趋势化的背景下,HTAP的四项核心技术使HTAP数据库相较于传统数据库在分析性与事务性方面均拥有更高性能、更高扩展性、更高新鲜度。但与此同时,HTAP的关键技术也使部分系统复杂性更高,在这样的背景下,HTAP数据库的应用需更加审慎,技术优化任重道远。


数据来源于大数据标准推荐委员会 、招商证券

二、下游行业数据库需求变化

数据库作为信创系统与信息核心软件系统中的核心部分,在信创产业国产替代浪潮涌动的背景下,迎来产业高速发展期,现阶段我国数据库产品的渗透率也屡创新高。随着互联网与大数据产业的发展,我国数据库用户的数量与数据资产规模累积均不断增加,在政务、互联网、电信、制造等行业已达到TB级别。在各类细分行业之下,用户对数据分析的需求参差不齐,对数据分析需求强烈的行业有金融、电信、互联网、零售等。

资料来源于 IDC SSCA TC601 大数据标准推荐委员会 、招商证券

资料来源于 IDC SSCA TC601 大数据标准推荐委员会 、招商证券

1、金融:数字化进程推动分布式数据库应用需求提升

海外数据库仍占据金融业数据库部署的主导位置,但同时国产应用持续深化。据信通院统计,以业务系统数量为计数单位,我国金融行业各类数据库占比为Oracle 55%、DB2 19%、MySQL 13%、PostgreSQL 6%。在金融业数据库应用中,国产替代趋势显著,存量数据库大量向分布式架构升级,非关系型数据库正加速落地。在金融业中,银行为数据库国产化替代深水区,根据《墨天轮2022年数据库大调查》,OceanBase、阿里云PolarDB、华为云GaussDB、腾讯云TDSQL以及某头部国产数据库厂商是银行业中使用最多的国产数据库,使用这些产品的受访者占比分别为23.4%、22.2%、21.5%、20.3%、17.1%,未使用国产数据库的受访者占比仅为10.1%。

数字化进程推动金融行业创新型业务发展,分布式数据库需求顺势提升。在数字化时代下,金融企业正往移动互联、数智赋能、开放融合以及全面安全信任等全新态势发展。随着金融信息化程度提升,金融业对数据库的要求进化到希望满足兼具高兼容、高弹性、高能、高一致、高连续、高安全且低成本的要求。根据IDC调研显示,而分布式数据库以其透明、弹性、安全以及对复杂业务逻辑的广泛支持能力,兼容了传统金融业务应用,能够应对数字化时代下金融创新的需求。

2、运营商:集中式数据库仍为主导,新兴需求层出不穷

我国电信行业采用私有云或自有机房部署的方式,集中式数据库仍占主导地位。电信行业大数据领域的三大数据域分别是B域,M域,O域。从三大域进行数据分析和挖掘,就是电信行业的大数据应用,比如地理化精准营销、成本精算等。

集中式数据库事务一致性、维护性能突出,被主要业务体系B域大量使用,占整个电信行业数据部署60%;分析型数据库通常被业务相对简单的O域和M域使用,占比不超过10%。

数据库发展以匹配电信行业应用的技术战略应从适应性、创造性、韧性三大关键切入。根据阿里云委托Forrester Consulting针对电信行业的研究结果表明,开拓适应运营商业务模式、适应市场不确定性;创造性地融合更多生态伙伴,以运营商核心业务为切入点,发展垂直应用,打造高性能、高弹性的数据库技术;以及可坚韧保障通信稳定畅通及云网安全,实现零宕机,为电信行业保障企业自身安全以及社会安全稳定而保驾护航。

在针对电信行业的技术发展方面,云数据库以及图数据库将因电信业务场景的需求而成为发展趋势。云数据库所具备的多元化能力,如一站式数据管理,可为电信行业的典型运营场景添瓦助力。据统计,34%的电信行业从业者表示一站式数据库是其最关注的云数据库能力之一。图数据库因其高效搜索、计算结果天然具有可解释性的能力,在电信行业几大典型场景中也具有很大的发展前景。


随着数据库技术的更新迭代,电信行业作为数据密集型行业,在原有数据库的基础上逐步开始进行系统改造,逐步实现国产替换。据大数据技术标准推进委员会研究表明,目前我国电信行业因数据安全等考量因素,行业几乎全部采用私有云或自有机房部署,数据库以集中式数据库为主。虽分布式数据库适用于电信行业业务弹性较大的业务系统,但由于电信行业使用数据库的时间较早,早期数据库发展并不全面,事务控制复杂且网络开销大等因素使分布式数据库在电信行业占比仅达到约10%。在电信行业的应用场景中,三大电信运营商在不断上线国产数据库产品,业务操作支持系统、营业员业务操作系统、反洗钱系统等重要系统均已实施国产替换,如渠道中心库、账务中心系统、权益中心系统等其他无原数据库基础的系统,也纷纷引入国产数据库的支持。

3、政务:数字政府建设进一步提升数据库需求

我国数字政府一体化大数据平台规模稳步增长,推动背后数据库需求提升。根据IDC分析,2022年我国数字政府一体化大数据管理平台规模达59.1亿元人民币,增长率为19.2%,呈现稳健增长态势。政府日益提升的大数据管理需求推动背后经济数据库、交通数据库、天气数据库等各类数据库搭建需求,进一步促进背后数据库基础设施需求提升。

政策推动数字政府建设,进一步提升数据库需求。各地方政府发表一系列地方政策文件,旨在推动我国各省市数字政府建设、政务数据管理和安全保障的现代化。政策的颁布强调了数据安全、合规性、资源共享、技术创新和协同工作,以确保政府部门和机构能够更好地满足公共需求、提高效率、促进数字化发展。

随着数据库技术的不断演进,政务数据库在满足政府机构不断增长的数据管理和分析需求方面发挥了关键作用。政务数据库在政府部门中扮演着至关重要的角色,因为政府机构需要处理和维护各种类型的数据,包括公民信息、行政文件、政策和法规、项目和资金分配等。随着互联网的迅猛发展和电子政务建设的不断推进,政府机构对信息系统的依赖性以及信息安全标准的要求日益增加。实现信息化系统的核心软件——数据库的国产化,不仅是技术领域的迫切需求,也是国家安全的共同关切。

4、互联网:云原生和分布式数据库已成为互联网行业主流

互联网行业对数据库的需求在不断演进,要求数据库提供更强大的性能、可用性、安全性和灵活性,以满足不断发展的业务需求。

应用于互联网行业的数据库正快速向分布式架构转型中。其中,分布式分析型数据库逐步成熟,已广泛应用于互联网用户画像等业务系统;分布式事务型数据库随着中间架构与新型一致性协议不断成熟,各互联网大厂均已实现用自研分布式事务型数据库支撑自身大规模实务操作。

云原生和分布式数据库已成为互联网行业主流数据库。互联网业务伴随着大规模的业务与特定时间的数据增长,传统的关系型数据库难以承载应用负载。根据阿里云委托Forrester Consulting对互联网行业的调研表明,对114名互联网企业云数据库负责人进行调研结果表面,有62%的受访者已经使用云上云原生关系型数据库以及分布式关系型数据库,大幅领先于传统关系型数据库。

5、 制造业:数据库创新初露头角

数据库为工业数字化建设的核心因素之一,国家发布多项政策推动发展。我国作为工业制造大国,2018年颁布《关于国家智能制造标准体系建设指南(2018年改版)》后相继颁布《产业结构调整指导目录(2019年本,征求意见稿)》、《计量发展规划(2021-2035)》多项政策文件。

制造业在我国行业信息化的进程中,数字化转型较慢,仍以关系型数据库为主。据《2023数字经济系列报告》指出,制造业的数字经济渗透率虽显著低于服务业,但依然呈增长趋势。随着数字化业务场景的不断丰富,非关系型数据积累增加,目前制造业关系型数据库仍占63%,用户使用两者参半的数据库占比约37%。

据亿欧智库统计,工业实时数据库市场规模预计2025年达到269亿元,CAGR为36.6%。离散制造业的数据采集市场规模约为流程工业的50-100倍,离散制造业应用实时数据库市场规模将于2024年突破100亿,约于2025年超过流程工业应用规模。虽然流程工业与离散制造对实时数据库的需求驱动不同,但需求目的具有共同性。

我国制造业数据库创新初露头角,国产替换逐步开启。据大数据技术标准推进委员会统计,目前我国制造业在研发设计、生产制造、经营管理三种主要业务系统中,Oracle数据库占主导位置。但随着制造业应用对数据储存需求、数据写入性能、查询实效性、大规模实时分析计算、数据互通等需求的提升,Orcale数据库的劣势逐渐显现,随着国产数据库的发展,国产替换的高度完成指日可待。我国工业数据环境面临着数据量不断激增数据类型复杂、数据治理难等问题,在系统兼容、数据共享、信息安全以及互联互通等方面的模式创新尚未实现。当前,工业领域数据量激增,数据库需求大,已有30多款时序数据库产品在新能源发电、储能智慧运维等场景中落地应用。

分厂商来看,根据墨天轮调查统计,制造业公司使用openGauss最多,其次为TiDB、蚂蚁OceanBase及某头部国产数据库厂商等。其中,OceanBase数据库为理想汽车提供“故障自动恢复” 和 “数据零丢失”服务,实现数据库故障减少80%、Li-MOS产线生产连续性提升、以及车云业务实现跨云异地多活。TiDB助力Vivo实现海量数据实时 OLAP 、云服务业务中的元数据管理等新优势。

6、能源:国产化替代持续发力

我国能源信创发展仍处于萌芽阶段,但由于细分行业数据基数较大,能源业已成为我国数据库主要市场之一。据赛迪顾问调研,2021年能源业数据库销售额为16.1亿元,占该年我国数据库行业市场16.1%。此前,能源行业数据库多以Oracle、MySQL、SQL Server 数据库为基础开发,现阶段已有多家能源公司开始进行数据库国产替换,包括石油石化、电力、煤炭、水利等领域。

国家发布多项政策推动能源数字化发展。国家能源局为落实“四个革命、一个合作”能源安全新战略和建设新型能源体系,连续两年先后发布《国家发展改革委国家能源局关于完善能源绿色低碳转型体制机制和政策措施的意见》与《国家能源局关于加快推进能源数字化智能化发展的若干意见》,在官方文件中明确指出要推动能源行业数据库开发,完善、更新能源数据库。各大省市人民政府办公室与人民政府办公厅也于今年发布推进智慧能源建设、推动能源管理数字化的多项政策文件。

能源行业数据库国产替代已深入核心系统。国家电网、中国华能集团、中国华电集团、中石油、中海油、中广核等大型能源企业均已采用国产数据库厂商产品,且国产数据库应用已深入国家电网的智能电网调度技术支持系统与核心电力调度系统等能源核心系统。除数据库厂商协助数据库改造以外,部分能源企业开启自研之路,国家能源集团自主搭建生产数据库,成为煤炭行业首个全时全融合数据库。

三、风险提示

  • 技术发展不及预期:国内数据库行业推进传统数据领域技术积累,以及分布式架构、图数据库、向量数据库、搜索数据库等数据库领域技术创新,若技术发展不及预期,可能导致国内数据库行业发展放缓;
  • 政策落地不及预期:国内数据库行业需求一定程度依靠信创及数字中国/数据要素等政策驱动,若政策落地不及预期,可能导致国内数据库行业发展放缓;
  • 行业竞争加剧风险:若国内数据库行业竞争加剧,可能导致个股盈利能力下降。