2019年国产数据库发展回顾与思考

发表时间: 2019-12-19 18:13

“想,都是问题,做,才有答案”

—–华东师范大学副校长、CCF数据库专委会副主任周傲英。

之所以开篇引用周教授这句话,是因为笔者觉得,这短短10个字,是对国产数据库发展的最好诠释。中国能否翻越数据库这座大山,一定不会是想出来,辩出来的,而一定是做出来的。

今年,笔者参加了不少数据库技术、生态会议,有开放也有闭门会议,也采访了不少厂商侧、用户侧的专家,对国产数据库的现状、发展、机遇、挑战的认知,也在不断更新,因此,觉得有必要总结记录下来。

分类

聊国产数据库,首先需要了解,国产数据库都有哪些,分属哪些类别。下图为笔者统计整理,肯定有遗漏,但基本上市场主流玩家都在其中。

关系型数据库和非关系型数据库NoSQL是目前数据库的主流分类,事实上,现在传统关系型数据库与NoSQL数据库的边界已经越来越模糊,比如,NoSQL系统也得去保证ACID guarantee。而传统关系型数据库也开始提供非结构化、半结构化数据的支持,比如说MySQL从5.7开始,PG11.0、11.2版本都加入了对Json的支持。

从上图可以看到,国产数据库经过这些年发展,早已经不再只有传统三剑客(达梦、人大金仓、南大通用),互联网巨头,网络通讯巨头、创业公司纷至沓来,呈现百花齐放、群雄汇聚的局面。

客观的说,国产关系型数据库,多源自或者借鉴开源MySQL、PostgreSQL数据库及其变种,或收购商业源码(例如Informix)+自研的方式;大数据平台,多源自或直接整合开源大数据生态组件;纯自研的国产数据库还是少数,数据库种类不够丰富,尤其NoSQL这块。

笔者并不反对国产数据库借鉴开源数据库MySQL、PostgreSQL,并因此消化、吸收、再创新,但并不支持在MySQL、PostgreSQL上穿个衣,带个帽,拉个双眼皮,简单的封装就展开销售,因为,这样的企业没有核心竞争力,早晚会被淘汰。

走红

今年,厂商侧数据库方面的活动明显变多,媒体这方面的选题也开始变多,数据库的突然走红,让很多人有些茫然,怎么数据库突然就火了?背后是什么原因?

有人说,数据是新能源,有人说,数字经济时代,数据是新的生产资料,算力是新的生产力。无论怎么说,核心意思就一个,数据从未变得如此重要。

什么是数据库?简单的说,数据库就是管理数据的,以前是,未来也是。因此,数据库自然就成为了信息化社会2.0的重要基础设施,走红也就不难理解。

从本质上看,企业数字化转型的需求与挑战,推动了国产数据库崛起和发展。

面对更为复杂的业务形态,企业需要构建更为复杂、灵活、可控的IT系统,在大数据量,高并发下,能处理更多的数据源和数据形态,并具有更好的弹性响应能力,企业对数据库需求与过去大不相同。

众所周知,传统数据库大都基于几十年前传统架构设计,早已不适应现在更复杂的应用需求和更新、更强大的硬件环境,否则,传统数据库霸主也不会被崛起的云数据库打的节节败退。

一个数据库通吃所有场景,还是特定场景用特定的数据库,争议由来已久,目前,大部分人更倾向于需要多种类型的数据库产品并存,以满足不同的业务场景需求。

毫无疑问,目前,国产数据库处在发展最佳时机,创新的商业模式,丰富的应用场景推动了数据库进入“升级换代”的时代,来自业务的挑战、成本的挑战、安可的挑战等也在推动数据库进入“升级换代”的时代。

突破

我们必须承认,目前,国产关系型数据库与国外标杆数据库的差距依然较大,但现在如果你还用传统的眼光去审视国产数据库,那就有些out了。因为,这种差距正在以肉眼可见的速度在缩小,在云数据库方面甚至比国外产品还有所超越。

2018年5月,星环通过TPC-DS,这是国产数据库首破OLAP的benchmark世界纪录。今年初,阿里云AnalyticDB也通过TPC-DS;

2019年5月,华为正式面向全球推出了GaussDB数据库,其GaussDB OLTP数据库已在招商银行综合支付交易系统成功上线投产,GaussDB OLAP数据库也已在工商银行内上线投产。

2019年5月,达梦发布DM8.0,同月,湖北银行新核心系统正式投产上线,10月23日,该新核心系统所引入的达梦数据库正式通过湖北银行项目方的验收。

2019年8月,腾讯云发布CynosDB商业化版本,智能数据库诊断系统DBbrain。11月,宣布开源TBase数据库,TDSQL数据库落地张家港农商银行新一代核心业务系统。

2019年9月,华为云在HC大会上发布了GeminiDB、TaurusDB和GaussDB OLTP上云。并成功帮助用友软件、锦江之星、一下科技等企业定制符合其行业特殊需求的数据库服务与解决方案。

2019年9月,阿里云推出POLARDB Box,这是业内首次推出基于云原生数据库的一体机。11月,Gartner公布2019年全球数据库魔力象限评选结果,阿里云进入“挑战者”象限,并连续两年作为唯一的中国企业进入该榜单。

2019年10月,蚂蚁金服OceanBase登顶TPC-C,这是国产数据库首破OLTP的benchmark世界纪录。OceanBase落地西安银行,西安银行完成实施互联网金融业务平台MySQL数据库、互联网交易资金存管平台Oracle数据库向OceanBase分布式数据库的完整迁移。

2019年10月,中兴GoldenDB成功帮助中信银行替换DB2,换“心”后的中信银行信用卡核心交易系统对外投产,这是全国性股份制商业银行的首例。

2019年10月,巨杉数据库作为唯一中国企业入围Gartner Peer Insights 2019年度评选,并位居第三。11月,连续第三年入选Gartner数据库推荐报告,同月,发布SequoiaDB 3.4。

………………………………

毫无疑问,过去的一年中,无论是在世界级的舞台上,还是在金融这类对数据库要求最高的行业的渗透,国产数据库都取得了具有里程碑意义的突破。

问题

虽然,国产数据库取得了极为耀眼的成绩,但这并不代表国产数据库就很完美,一些亟待解决的问题依然存在。

从用户的角度看国产数据库,主要存在几个方面的问题,

首先,是标准问题,没有统一的标准,国产数据库厂商多而不精,用户并不知道选谁好,选谁放心?

其次,是用户生态问题,用户遇到问题,要解决很困难,找不到解决问题的办法,没有专门的学习平台,网上资料少的可怜。国产数据库大多只关注将产品卖出去,因此往往只重视合作伙伴、客户、交付生态,却忽视了面向产品、DBA的用户生态。

最后,这点比较特殊,但又确实存在的问题,那就是实力,数据库是应用软件核心,产品本身重要,企业自身实力也很重要,一些要求严格的行业,准入的门槛不仅是产品优秀,供应商得有“扛锅”的能力。

从合作伙伴的角度看国产数据库,存在的问题也不少。

首先,缺乏成熟应急服务保障机制,售后服务过度外包,数据库紧急故障过程中,当合作伙伴搞不定,原厂怎么能够及时支持,是应该需要思考的问题。

第二点是生态,国产数据库不仅自身产品要强大,周边生态的完善也很重要,与周边上下游产品的兼容性,配套软件、工具、技术人才等等。

第三点继承性、跨版本迭代过程中的新版本对原有应用的兼容性如何保证,包括产品命名体系,UI界面风格、编程接口、数据类型、SQL标准及方言等,避免颠覆式变化。

第四点弹性能力,云化数据库服务,是未来发展方向。通过弹性伸缩支持客户业务的快速发展,通过多租户实现资源灵活管理,是必要的。

最后,是技术路线图,很多厂商不愿意向外界宣贯未来3-5年的持续性的版本计划和迭代策略以及成长路径,用户需要的特性很难及时响应,这导致用户很难把控。

最后

笔者认为,真正的强大不是完美,而是能正视自己的不足,认清差距,这样才能有更强的动力砥砺前行。

作为数据库领域的一名观察者,笔者真诚的希望,国产数据库能越来越好。