OceanBase杨传辉谈开源与商业数据库的未来|钛媒体AGI

发表时间: 2024-04-22 20:41

(图片来源:unsplash)

近期,百度创始人、董事长兼CEO李彦宏称开源模型会越来越落后,引起行业对‘开源’技术的广泛讨论。不止在AI大模型领域,包括开源数据库等多个领域的重要从业者也对此表达看法。

4月20日上海OceanBase开发者大会上,OceanBase首席技术官(CTO)杨传辉对钛媒体App等表示,仅从数据库领域而言,开源技术对于行业的意义非常重要,开源和商业化数据库都有一定的生存空间。

“就开源和商业化定位来说,我认为,首先我要把开源做好,我一定要使开源出去的东西足够有诚意,能够真正解决用户核心痛点;但同时,开源之后又不能让这家公司完全不商业化,那也活不下去,最后开源社区也没了。在OB这里,数据库相当于发明的一个自行车,‘开源’是教你怎么去骑自行车,‘商业’是卖给你一个好的自行车,但你不会骑没用,开源对我们的商业化反而有助力。对OB来讲没有问题,我们可以把开源和商业很好地融合在一起。”杨传辉表示。

OceanBase首席技术官(CTO)杨传辉

事实上,作为一款100%根自研的分布式数据库,OceanBase持续践行一体化数据库的产品战略,以负载关键业务系统。

2020年,OceanBase宣布独立商业化运作。当时OceanBase表示,在原有功能基础上增加分析型业务处理能力,OceanBase 将升级为一款支持 HTAP 混合负载的企业级分布式数据库。

2022年,OceanBase发布4.0版本,从技术上首次突破分布式数据库的单机性能瓶颈,实现单机分布式一体化。目前在一体化上,OceanBase已实现单机分布式一体化、TP/AP一体化、云上云下一体化、多模一体化等,用一个数据库满足客户80%的场景需求。

2024年4月,OceanBase发布4.3版本,推出列式存储引擎,打造PB级实时分析数据库,可实现秒级实时分析,进一步加强TP/AP一体化。现场跑分显示,在同等硬件条件下,OceanBase4.3的AP查询性能已达到业内一流列存大宽表数据库同一水平。

此次OceanBase开发者大会上,杨传辉表示,OceanBase 4.3在TP/AP一体化上的进一步突破,也是OceanBase坚持100%根自研的产品力结果。不基于开源数据库二次开发、自建研发环境和流程,才使OceanBase具备对内核代码的完全掌控力和掌控权,才具备更强的突破复杂业务场景和为关键业务系统兜底的能力。这标志着其在“关键业务负载”一体化战略上迈出重要一步。

值得一提的是,今年3月,蚂蚁集团宣布,OceanBase已成立董事会,独立面向市场。

谈及此事,杨传辉表示,“这体现了蚂蚁对把一个数据库长期持续做下去这件事情的更加笃定、更大投入,这是一个核心。基于这个核心,我觉得对我们的产品技术是利好。今天,大家看到OceanBase在业界得到了一定的认可,但还没有完全成功。我们相信,一体化架构不管是在国内还是在国外、在全球范围内,它都有机会成为新的主流。基于这样的思考和判断,才有信心使其独立运营,接受市场考验。”

“数据库这件事要真的做好,首先要敢于挑战最难的事情,敢于自研做TP(transaction processing,面向交易的处理系统)。TP壁垒是极强的,TP的壁垒和用户场景的积累,才会使得一款数据库形成特别大的生态。在这个过程中,我们非常欢迎竞争,并不是要成为‘一枝独秀’。从商业的角度来看,有些公司的衰败是因为没有竞争,而不是因为竞争多,良性竞争对所有参与者都是好事。”杨传辉称。

目前,OceanBase Landscape技术生态已扩展至超750个主流产品,覆盖基础设施、数据集成、数据治理、应用集成等多个领域。OceanBase已经服务超过1000家行业客户,其中30%将其应用于核心系统。

谈及新一轮 AI 热潮,杨传辉指出,GPT大模型对于数据库有很大影响,尽管目前OceanBase没有专门支持向量数据库产品,但整个插件和社区已具备向量数据库的能力,目前开源社区已有基于OB开源版去做向量Demo的尝试。“往后,我们会往这个方向去布局研发,现在有一些尝试。”

清华大学教授、蚂蚁技术研究院院长陈文光表示,AI 大模型的发展和崛起,对整个的数据处理、数据库领域也提出了很多新的需求。

展望未来,陈文光在演讲中表示,未来数据库领域有三大新趋势:在线离线一体化;向量数据库和关系数据库的一体化;更大的愿景是数据处理与 AI 计算的一体化。

“之前的数据处理更多是偏底层的方式去做的,然后先去收集、存储,后面做记账,再上面在这个数据上做一些分析聚合。AI已经越来越多的占有整个计算的成本、容量,如果是这样的情况,我们的数据处理跟AI到底应该是一个什么样的关系?我认为它也应该是有一个一体化的趋势。”陈文光称。

杨传辉在演讲结尾表示,“我希望,未来在OceanBase开源社区里面,应该有越来越多像‘向量数据库’这样的有趣尝试,我们的开源社区不是冷冰冰的产品,而是一个连接你我的,让大家交朋友好玩的地方,一个真正的社区。”

(本文首发于钛媒体App,作者|林志佳)