2021年数据库年度盘点:PostgreSQL的崛起与Cloudera的危机

发表时间: 2022-01-04 16:33

作者 | Andy Pavlo 编译 | 郭露
出品 | CSDN(ID:CSDNnews)

2021数据库行业迎来蓬勃发展,各大公司争先恐后推出新兴技术,供应商为了进行融资同样挤破了头。在为数据库发展欢欣鼓舞同时,同样有许多公司面临收购、破产或是撤资危机而退出历史舞台。

在2022年即将到来年的今天,我们要对过去一年进行反思和总结,同时对未来一年的数据库发展进行预测。

PostgreSQL依旧占据主导地位


随着开发人员喜好的改变,开源数据库PostgreSQL已然成为各应用程序的首选。PostgreSQL有着安全可靠、功能齐全的优势,同时还在不断进行完善。2010年,PostgreSQL开发团队表示,软件版本(H/T Tomas Vondra)将每年更新。

对于各大系统而言,PostgreSQL的高兼容性是它最具优势之处。PostgreSQL可兼容SQL方言(DuckDB)、线路协议(QuestDB、HyPer)或整个前端(Amazon Aurora、YugaByte、Yellowbrick)。越来越多的大型公司都开始采用PostgreSQL。今年10月份,谷歌宣布在Cloud Spanner中兼容PostgreSQL,并推出了Babelfish功能,将SQL Server工作负载迁移到Aurora PostgreSQL。


据DB-Engine排名显示,截至2021年12月,PostgreSQL仍然是第四大最受欢迎的数据库(位列Oracle、MySQL和MSSQL之后),但在过去一年,它与MSSQL的差距在不断缩小。

观点:鉴于Ted Codd在1970年代的关系模型的影响力,关系型数据库系统如今成为新应用程序的首选。不可否认的是,尽管PostgreSQL依旧存在许多不足,它依旧是一款优秀的数据库,就像每一个DBMS一样。如今越来越多的人开始关注PostgreSQL,PostgreSQL在未来只会不断完善。


数据库供应商争乱不休


今年,各数据库供应商在基准测试结果上依旧互不相让。为了进行公正的评判,TPC基准程序应运而生然而,随着TPC的影响力逐渐衰弱,新一轮的数据库基准纠纷再次开启。

2021年间先后出现三次基准结果测试纠纷,分别为Databricks和Snowflake;Rockset、Apache Druid和ClickHouse;ClickHouse和TimescaleDB。


数据库融资潮


自2020年下半年以来,金额在1亿美元以上的投融资越来越多。2020年的大型融资数量为327次,但其金额不到投资总额的一半。截至2021年1月,这类融资数量达100多个。

2021年各数据库公司获得的融资数目极为庞大。针对运营型数据库而言,今年年初,CockroachDB狂揽1.6亿美元融资,并在12月份再次获得2.78亿美元融资,成为今年融资金额最多的公司。Yugabyte完成1.88亿美元C轮融资并成功盈利。PlanetScale为Vitess技术获得2000万美元B轮融资。而NoSQL公司DataStax同样为Cassandra融资3760万美元。

然而,分析型数据库市场更加火热。2021年9月,TileDB获得融资并拒绝披露其金额。Vectorized.io为其兼容Kafka的流媒体平台融资1500万美元。StarTree宣布获得2400万美元融资,用于构建Apache Pinot商业化。Matviews-on-steroids DBMS Materialize宣布其C轮融资获得6000万美元。SingleStore在2021年9月筹集了8000万美元,离上市更近一步。今年年初,Starburst Data为其Trino系统(原PrestoSQL)筹集了1亿美元。Firebolt作为另一家DBMS初创公司,宣布为其基于ClickHouse分叉的新云数据仓库系统筹集了1.27亿美元。新兴公司ClickHouse获得了高达2.5亿美元的融资,以围绕该系统建立一家新公司(并从Yandex获得使用ClickHouse名称的权利)。

然而,在所有融资当中,今年的最大赢家是Databricks,他们在2021年8月获得高达16亿美元的融资。

观点:如今我们正处于数据库的黄金时代,市面上出现了各种优质数据库。投资者也在不断寻找能成为下一个类似Snowflake的IPO数据库初创企业。数据库初创公司获得的融资比以往要多得多。例如,Snowflake直到成立五年后的D轮融资才获得1亿美元,而Starburst在不到三年的时间内就完成了。尽管融资涉及各方面的因素,但融资金额越来越多已经成为趋势。


缅怀,为那些消失的数据库公司


与那些获得大量融资的公司相比,在过去的一年中,有不少数据库公司走向瓦解。

1. ServiceNow收购Swarm64

Swarm64最开始的主要业务为PostgreSQL上运行分析工作负载的FPGA加速器。之后发展成为使用扩展的PostgreSQL软件加速器。但当其他数据库大力融资时,Swarm64却并未做出任何行动。如今遭到收购后,公司并未提到Swarm64产品是否会继续提供支持。

2. Splice Machine破产

Splice Machine专注推进混合型(HTAP)DBMS发展,并采用HBase和Spark SQL处理工作负载以及分析。同时,Splice还为运营/实时ML应用提供支持。然而,由于OLTP和OLAP系统占据主要市场,该一体化混合系统未能在数据库市场上立足脚跟。

3. 私募股权公司收购Cloudera

在取消MapReduce和Hadoop技术后,Cloudera在云数据仓库市场中一直表现平平。Impala和Kudu中的大部分初始团队均已解散,尽管其项目依旧在开发并推出新版本。Cloudera股票迅速下跌,甚至低于2018年IPO的价格。如今尚不能确定投资者是否能够扭转局面。

观点:尽管数据库项目或公司的倒闭是大家都不愿看到的局面,但这就是数据库行业的残酷之处。开源技术可能会让DBMS走得比它的公司还要长久,但这并不是绝对的。由于数据库的复杂性,员工需要不断修复问题并增加新功能。即便是将已停用的DBMS的源代码权利和控制权转移到开源软件基金会,例如Apache基金会或CNCF,也不能保证项目能够起死回生。举个例子,RethinkDB在破产后被赠给了Linux基金会,但从Github上看,RethinkDB已经无力回天了。同样面临这种困境的还有DeepDB:该公司在倒闭后为代码创建了一家非营利性基金会,但加入的人寥寥无几。

由于大型云计算供应商或是资金充足的初创公司的迅猛发展,预计到明年会有更多的数据库公司面临倒闭。但在未来数据库依旧是一个充满活力与创新的行业,我们很高兴能够参与其中。

原文链接:
https://ottertune.com/blog/2021-databases-retrospective/

本文已获原作者授权,未经允许,请勿转载!