中国自研数据库里程碑:超越Oracle,登顶全球!

发表时间: 2019-10-05 11:55

10月2日,在浓浓的国庆气氛中,一场“技术阅兵”在大洋彼岸上演。

结果再添喜气:继5G移动通信和高端芯片之后,中国公司在又一个“核高基”领域取得了重大突破。

蚂蚁金服自主研发的数据库OceanBase打破数据库基准性能测试的世界记录,成绩是前世界记录保持者、老牌巨头甲骨文(Oracle)的两倍。数据库领域最权威的国际机构国际事务处理性能委员会(TPC,Transaction Processing Performance Council)在官网发表了这一最新结果。

对此,中国工程院院士、计算机专家李国杰表示:OceanBase打破了由甲骨文保持了9年之久的TPC-C基准性能测试的世界纪录,“是中国基础软件取得的重大突破”。

长期依存

时间回到1997年,北京机场跑道上,国宾车队一字排开、闪着大灯。

甲骨文创始人埃里森(Larry Ellison)初次到访中国,这位数据库帝国的掌门人计划到长城拍摄推广网络计算机的宣传片,时任甲骨文中国总裁的冯星君找了20个小学生一同参与拍摄。

约好早上8点开拍,但直到9点,埃里森还没起床。

当天的北京零下二十几度,小学生们在没有暖气的大巴上苦等,冯星君带着哭腔给埃里森电话,一个多小时后,大老板才终于现身。

无奈的等待和敢怒不敢言背后,是国内在数据库服务上对甲骨文的全面依赖。

彼时的中国,商业力量快速复苏,外贸进出口总额突破4000亿美元大关,相伴而生的,是信息技术需求的井喷。甲骨文的数据库,正是软件中最硬的核心技术。

不能说国产数据库完全不行——但上世纪90年代才蹒跚起步的国产数据库,中国已经来不及等它长大。战场迫不及待需要成熟的战士。

于是,国内几乎所有机构和公司,从金融、电信到航空,清一色地使用甲骨文。

这意味着,中国人每一笔银行取款、转账,每一次充话费、买机票的数字,都储存和运行在美国的数据库上。

自主研发

数据库的重要性丝毫不亚于芯片,没有数据库,就没有信息科技的发展。受制于人的局面急需改变。

2006年,国务院发布《国家中长期科学和技术发展规划纲要(2006-2020年)》,提出“核高基”的概念。“核高基”是对核心电子器件、高端通用芯片及基础软件产品的简称,同时也是与载人航天、探月工程并列的16个重大科技专项之一。其中,基础软件就包括数据库、操作系统、中间件等。

不过,赶超之路谈何容易。

此次以两倍优势反超的阿里巴巴一度是甲骨文中国的标杆客户,淘宝、支付宝等公司98%以上的软件系统和业务都由甲骨文数据库提供数据服务。但随着双11成为现象级商业活动,几何级增长的交易量把一个严峻的问题摆上台面:如果继续使用甲骨文,为了应对天量数据,只能再花上亿人民币购买主机。

他们选择了自主研发。

当时阿里有自己的数据库研发团队,但很多人不看好。毕竟甲骨文有十几万人,从事核心数据库研发的超过两千,而阿里数据库团队20多个人,团队负责人阳振坤此前在另一家大厂开发数据库,两年多没出成绩被扫地出门。

所幸新东家给了足够的耐心和支持,才有这个后来居上的故事。

如今,OceanBase已在蚂蚁金服和阿里巴巴的业务系统中得到广泛应用。数亿人能够随时随地网购、移动支付,背后都靠OceanBase数据库的力量。从2017年开始,OceanBase数据库开始对外开放,服务包括银行、保险等金融机构。

创造纪录

TPC-C是全球主流计算机硬件厂商、数据库厂商公认的评价标准,被誉为“数据库领域的世界杯”。

TPC-C标准模拟了经典商品销售付款场景来做测试,通过每分钟创建新订单数量来评价数据库的性能和性价比。OceanBase以60,880,800 tpmC(每分钟内系统处理的新订单个数)创造了新的联机交易处理系统(OLTP)世界纪录。

过去数十年,TPC-C一直是海外传统数据库厂商竞技的舞台,而OceanBase是登上TPC-C排行榜前列、由中国公司完全自主研发的第一款大型数据库产品。

尤其值得一提的是,OceanBase不仅在性能指标上创造了新纪录,还成为全球首个通过TPC-C审计的分布式无共享关系数据库。据介绍,此次TPC-C测试结果是在阿里云标准云资源支持下实现的,改变了之前高性能测试结果都依赖专用集中式存储设备和管理软件的实现方式,以完全分布式的软件架构达成这一突破性成果。

此次登顶国际权威排行,也是云时代中国数据库换道超车的标志。

趟出新路

OceanBase的崛起,不只是商业力量竞逐的结果,更有时代变革的红利。

此前,国产数据库之所以没有得到广泛使用,原因主要在于金融、电信、航空等关键行业必须确保数据库的可用和稳定,无法给新兴的国产产品试错空间。

而电子商务完全是新兴领域,双11的交易规模,完全超出甲骨文的经验范围,反而有了趟出一条新路的机会。

OceanBase是云计算时代中国数据库的代表。几乎同一时期,达梦、人大金仓、神通、南大通用等一批国产数据库都陆续应用到央企、国家财政、军事等专用领域。华为、腾讯等中国公司也纷纷推出了自己的数据库产品。

但与此同时,在底层核心技术突破、产业生态建设等方面,国产数据库仍面临挑战。

据第一财经报道,深耕数据库领域多年的南大通用首席技术官武新曾表示:甲骨文、微软等公司经过几十年的发展,建立起非常强大的生态系统,这种依存关系还将维持一二十年,而中国的生态系统仍然较为薄弱,这与缺乏技术基础积累有关。

数据库是支撑人工智能、区块链等新技术的基础技术,尤其是在核心敏感行业,自主可控意义重大。建设强大完善的自研数据库,中国技术人仍在“升级打怪”的路上。(科技日报记者 崔爽)