一、概述
数据库是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。
数据库分类
资料来源:智研咨询整理
数据库管理系统是数据库系统的核心组成部分,主要完成对数据库的操作与管理功能,实现数据库对象的创建、数据库存储数据的查询、添加、修改与删除操作和数据库的用户管理、权限管理等。
按数据模型分类的数据库管理系统
类别 | 定义 | 适用场景 |
关系型数据库管理系统(RelationalDBMS) | 支持关系型的表数据(行与列)管理方式的数据库。通常访问方式为SQL语言。 | 适用于以行列方式进行数据组装的关系型数据应用。其关注事务(交易)ACID特性,且拥有复杂SQL查询诉求。 |
文档数据库(DocumentDBMS) | 以“文档”存放数据的没有特定数据模型的存储模型。其往往采用带有具体含义的内定符号进行数据单元切割。基于文档存储的数据可以直接通过上层应用进行操作。 | 适用于对关联查询、事务要求不高且数据模型不明确的场景。例如会话保存、购物车等。 |
时序型数据库管理系统(TimeSeriesDBMS) | 专门针对时序型数据(一种任何操作都必须带有时间戳的数据类型)进行优化的数据库。 | 适用于更关注时间点的工业及物联网场景,例如各类传感器仪表等无需对数据变更的数据采集场景。 |
图形数据库管理系统(GraphDBMS) | 数据以图结构存放的数据库。其中图数据结构指的是像“节点”“边”(节点之间的关系)的形式。往往用于计算“图”的特定属性,例如一个节点到另一个的跳数。 | 适用于类似社交网络、金融风控、推荐系统等专注于构建关系图谱的业务场景。 |
空间型数据库管理系统(SpatialDBMS) | 用于例如“点”“线”“面”这样的典型空间数据类型的存取与运算的专用数据库。此类数据库往往支持专门用于加速空间数据操纵的空间索引。 | 适用于空间地理数据操作场景,如卫星遥感、自然资源等。 |
混合型数据库(HybridTransactionandAnalyticalProcessDBMS) | 兼容存储和计算模型,可以同时存储和处理关系型和非关系型数据的数据库。 | 适用于对异构数据互通共享有需求的业务场景,以及同时有事务类和分析类需求的业务系统。 |
资料来源:智研咨询整理
二、市场规模
全球数据库产业生态成熟壮大,在发展过程中,逐渐细分出数据库产品、数据库服务和数据库支撑体系三个细分产业。
数据库产业链
资料来源:智研咨询整理
自2013年至今,数据库企业累计完成约42次融资,根据披露金额显示,融资额度总计约为78.6亿元。自2014年成立的以数据库产品供应与服务提供为主营业务的企业为29个,其中24个企业先后获得单笔数百万元至最高2.7亿美元融资,仅2021年一、二季度期间,获得最新一轮融资的企业数就达12家,2020全年获得融资的企业数量为17家,占比59%,其中不乏高瓴创投、经纬中国、红点创投、红杉资本等知名投资方。
资料来源:中国信通院、智研咨询整理
近些年随着国产数据库概念的火热与应用需求多样化带动的技术变革,国内外各路资本纷纷注入数据库产业,形成“百舸争流”的旺盛态势。2020年中国数据库市场规模达240.9亿元,未来将继续保持增长,预计到2025年中国数据库市场规模将达到688.02亿元。
资料来源:中国信通院、智研咨询整理
2020年全球数据库市场规模为671亿美元,预计到2025年,全球数据库市场规模将达到798亿美元。中国的IT总支出将占全球12.3%。预计,中国数据库市场在全球的占比将在2025年接近中国IT总支出在全球的占比,中国数据库市场总规模将达到688亿元,市场年复合增长率(CAGR)为23.4%。
资料来源:中国信通院、智研咨询整理
智研咨询发布的《2021-2027年中国数据库行业市场经营管理及投资前景预测报告》数据显示:2020年中国数据库市场规模为35亿美元(约合240.9亿元人民币),占全球数据库市场规模的5.2%,预计到2025年中国数据库市场规模占全球数据库市场规模的13.35%,较2020年的5.2%增长8.13%。
资料来源:中国信通院、智研咨询整理
三、企业分布
截止2021年5月底,我国数据库产品提供商共计80家。成立时间呈现两个热周期。从企业成立时间看,我国数据库企业成立时间主要集中在1999-2000年和2013-2017年两个时间段,数量分别是12个和38个,依次占比15%和48%。上世纪90年代,以Oracle.DB2等为代表的国际商业数据库进入大陆市场,先后在电信、金融、政务等重要行业拿下大单,应用于各类核心系统和周边系统。国内也由于顶层设计加码,掀起一股国产数据库的浪潮。2012年,大数据成为国家级发展战略。在此背景下,我国涌现出一大批以大数据和数据库为主营业务的初创公司。2015年,平凯星辰、星瑞格、华胜信泰、上海丛云、恒辉信达等企业成立。2016至2018年,图数据库和时序数据库关注度不断提升,以费马科技、创邻科技、欧若数网、蜀天梦图等为代表的初创图数据库企业相继成立,以浙江智臾、涛思数据等为代表的时序数据库企业不断涌现,政策利好与资本关注为我国数据库产业不断注入新活力,国产数据库产业迎来第二轮浪潮。
资料来源:中国信通院、智研咨询整理
地域分布以一线城市为主,总部分布情况代表企业所在城市对数据库产业的重视与发展程度。从企业总部的数量看,由于人才规模聚集效应,企业总部通常设在超一线城市,数量最多的前五名是北京、杭州、上海、成都和深圳,分别是43、9、7、3、2个,占企业总数约为54%、11%、9%、4%和3%,除此之外,济南、南京、天津、武汉、广州、贵阳、福州、合肥和乌鲁木齐等直辖市和省会城市平均孵化出1-2个数据库企业。
资料来源:中国信通院、智研咨询整理
员工数量普遍在百人以下,我国数据库企业人员平均人数约为184人,最高为1200人左右规模,最低为10人左右规模。其中21-50人左右规模企业占比最高,数量34个,比例达到43%,人数在51-100人左右规模次之,数量为12个,占比15%,101-200人和201-300人规模并列第三,均为10个,分别占比13%,由此可见,我国数据库虽然数量众多,但平均从业人员数量较少,仍在快速发展阶段。
资料来源:中国信通院、智研咨询整理
平均专利数量不足五十个,我国数据库企业针对数据库领域的平均专利数量(含国内外专利)为38个,最高为500个左右规模,数量为0的企业个数是19个,占比24%。拥有专利数0-4个的企业占比最高为51%,专利数5-10个的企业次之,占比14%,专利数21-50个的企业数量排名第三,占比12%。从企业专利数量上看,Oracle以1.4万个全球领先,SAP居次席,国内数据库的全部企业技术专利累计千余,仍有较大发展空间。
资料来源:中国信通院、智研咨询整理
四、产品分布
我国数据库产品数量分布呈现以关系型为主,非关系型及混合型数据库为辅的局面。数据库产品根据研发方式不同,分为完全自研和基于开源二次研发两类。
我国关系型数据库产品多数基于MySQL和PostgreSQL二次开发而来。截止2021年6月,我国数据库产品共有135款。其中关系型数据库81个,非关系型数据库有54个,占比分别为60%和40%。按二级细分类别,以云服务为主要服务交付方式的关系型云数据库19个;非关系型数据库中,键值型数据库5个,列存数据库3个,文档数据库4个,图数据库13个,全文检索数据库1个,在非关系数据库中依次占比9.26%、5.56%、7.41%、24.07%和1.85%,由于一些不可控因素,其余非关系型数据库的数据模型暂不可知。
资料来源:中国信通院、智研咨询整理
关系型数据库中基于开源数据库MySQL和PostgreSQL进行二次开发的个数分别为23和24个,依次占关系型数据库比例为28.40%和29.63%,总计占58.03%。我国非关系型数据库产品发展势头良好,逐渐受到国际认可。非关系型数据库中以基于开源数据库如Redis.Inf1uxDB、CouchDB等产品进行二次开发为主。时序数据库因其存储处理海量时序数据的特性,常应用于工业控制、物联网、车联网等领域。
资料来源:中国信通院、智研咨询整理
我国时序数据库从2000年后迅速发展,产品数量已达15款,1款为开源数据库,其余均为商业数据库。4个由云厂商提供,还有来自石化、电力、钢铁等传统工业实时数据库企业的产品9个。2021年5月的时序数据库的流行度排名中,我国上榜的数据库产品已有两个,分别是浙江智臾和阿里云TSDB,依次位列第11和第21名。由于图数据库能够支撑社交网络、金融反欺诈等互联网与金融场景的关联分析业务,所以行业关注热度自2016年以来逐渐升温。
我国图数据库产品数量为13款,自研程度较高,自研产品占总数比例为69.23%。从供应商类型看,初创公司、云厂商、高校纷纷入局,其比例分别为7:5:1。2021年5月地图数据库的流行度排名中,我国上榜的数据库产品有3个,分别是欧若数网NebulaGraph华为云GraphBase和百度智能云开源产品HugeGraph,依次位列第15、第28和第30名。
在2021年5月图数据库的流行度排名榜中,中国上榜的数据库产品统计
资料来源:中国信通院、智研咨询整理