昨天,一篇题为“StarRocks 开源 —— 携手未来,星辰大海”的公众号文章,在开源圈内引发巨大争议。
这篇文章,以一封公开信的形式,向“各位大数据从业者”描述了目前数据分析构架所面临的各种困难和挑战,随后宣布“将核心产品 DorisDB 升级为 StarRocks,并全面开源(Github 搜索‘StarRocks’),和全球大数据从业者一起构建新一代极速统一的数据分析架构!”文内,包括阿里巴巴贾扬清在内的一众大佬,通过视频的形式为其站台背书。
然而,这篇文章不仅没有为 StarRocks(原 DorisDB)收获一分好感度,反而引发了开源圈的“众怒”。
就在刚刚,沉默了一天的 Apache Doris 也发布了最新声明。
Apache Doris 对大家关心的“ Apache Doris 和 DorisDB、StarRocks 的关系”、“社区分化的原因”等问题做了答复,并就 StarRocks 本次“更名”和 “开源”做了表态。
Apache Doris 表示,因为 StarRocks 选择的 Elastic 开源许可协议,OSI 根本不认可,“OSI 认定其是‘伪开源协议’,充其量叫‘源代码可获取’”。“祝未来一切都好,StarRocks 飞得再高,也是站在了巨人肩膀上”。
SegmentFault 思否技术编辑团队在第一时间跟踪本次事态的发展,访谈 Apache Incubator(孵化器)PMC(项目管理委员会)吴晟,收集相关资料,对其存在的争议展开调研。并就此事件,向 StarRocks 团队提出灵魂九问:StarRocks,关于这几个问题,你怎么看?
提到 StarRocks 不得不提其“曾用名”DorisDB,查看 StarRocks 公众号账号主体信息可以发现,其公众号注册于 2020 年 07 月 29 日,注册名为 DorisDB,并在 2021-09-08 更名并认证为 StarRocks。
在过去很长一段时间,鼎石公司都在使用 DorisDB 的品牌进行市场营销及推广,然而我们了解到 —— Apache Doris 作为开源项目在捐赠给 Apache 软件基金会时,就曾在其软件授权协议中明确:Doris 品牌及其品牌相应的版权、logo、商标等都一并捐赠给基金会。而基金会也明确规定,任何第三方公司,不得将 Apache 及其项目名称用于任何第三方商业公司的品牌。可见 DorisDB 这一品牌名称明显侵犯了 Apache 软件基金会的相关权益。
据了解,作为 Apache Doris 的捐赠方百度,Apache Doris 项目导师姜宁,Apache 孵化器 PMC(项目管理委员会)吴晟,都曾多次直接或间接劝阻鼎石公司、联系其投资人加以劝阻无果。
而本次更名也并非其公关文中所谓“品牌升级”,而是迫于各方压力的无奈之举。但全文看下来,我们丝毫没有看到鼎石公司对于长期侵权行为的悔过和歉意,回避事实,无比高调。
侵权使用 Apache Doris 的品牌名,那么在技术层面,StarRocks 与 Apache Doris 有关联吗?答案是肯定的。
虽然山寨一词并不准确,但 StarRocks 毫无争议是 Apache Doris 的 Fork 版本,在其代码中,Apache Doris 的代码,Apache 的 License 被得以保留,在其项目声明中也明确表示了其项目源自于 Apache Doris。而这一点在 StarRocks 宣布开源的文章中并未提及。
按照 GitHub 上的 Commits 数计算,最近一年 Apache Doris 项目贡献的前 20 位分别为:
1. Moringman(陈明雨-百度)
2. Yangzhg(杨政国-百度)
3. HappenLee(李昊鹏-百度)
4. stdpain(冯浩桉-前百度,一个月前刚刚入职鼎石)
5. EmmyMiao87(缪翎-百度)
6. xinghuayu007(汪细勖-小米)
7. caiconghui(蔡聪慧-小米)
8. Weizuo93(魏祚-小米)
9. acelyc111(赖迎春-小米)
10. xy720(徐洋-百度)
11. Hf200012(张家峰-海底捞)
12. Liutang123(刘立家-美团)
13. Qiye(齐建亮-百度)
14. Zouxinyi(邹新一-百度)
15. Huangwei(黄威-小米)
16. Wanbo(王博-美团)
17. Luozenglin(罗甑林-百度)
18. TingSun(孙挺-学生)
19. Pxl(潘肖磊-百度)
20. Haotan(谭浩-头条)
除一位刚刚离职百度入职鼎石短短一个月的工程师外,我们并未在这份榜单中看到鼎石公司的身影。可以说其对 Apache Doris 项目的贡献已经不能用多少衡量,而是鼎石公司已经完全脱离了对上游项目的贡献,只维护其 Fork 的版本和商业私有化版本。
当然作为一家商业公司,我们无意评价其不参与或少参与开源项目,我们批判的是下一个问题,似乎鼎石公司一直在刻意营造其与 Apache Doris 的紧密联系。
众所周知,Apache Doris 是由百度捐赠到 Apache 软件基金会的开源项目。
但除了侵权使用 Doris 的品牌外我们发现,鼎石公司还存在其他可能存在误导的行为 —— 在搜索引擎上搜索“Apache Doris”我们可以发现鼎石公司通过购买“关键词广告”的方式名列第一位。在 StarRocks(原 DorisDB)的微信公众号中也曾发布大量 Apache Doris 技术实践的文章。
我们鼓励其积极推广开源技术的行为,但这背后是否存在某种暗示或刻意引导呢?是否希望让用户将 DorisDB 与 Apache Doris 划上等号?我们不得而知。
在此特别说明的一点是,我们从来不批判商业软件,不从道德层面批判你是否参与、贡献开源,也并不反对任何公司基于基金会的任何开源项目去做商业化,批判的是在这个过程中故意模糊概念、不实事求是、违背开源精神的行为。
抛开以上不谈,StarRocks 文章中最核心的观点“将核心产品 DorisDB 升级为 StarRocks,并全面开源”同样受到了圈内的广泛质疑。
据 GitHub 公开信息显示,StarRocks 目前所谓的“开源”采用了 Elastic License 2.0。但问题是,这并非 OSI 认证的开源 License。
开源促进组织 OSI (Open Source Initiative,也被译为开放源代码促进会 https://opensource.org/ )是一个推动开源软件发展的非盈利组织。OSI 定义了近百种开源协议,这已经成为了开源协议的事实标准。换句话说,不被 OSI 认可就不是开源。
面对外界的质疑该公司“开源”的问题,StarRocks 方面表示,该公司已在 GitHub 上做了详细说明。
StarRocks 表示,Elastic 等开源软件公司会更倾向于和那些为开源社区做出贡献的公司合作。他们采用 Elastic License 2.0 作为开源许可证,可以确保用户可以继续免费使用、修改和分发 StarRocks 的源代码,同时保护 StarRocks 的版权和商标。
在我们看来 StarRocks 在这一问题上意图刻意混淆概念,Elastic 修改开源协议其本意是保护自身原厂的权益,要求未对项目作出贡献的情况下不得发布自己的开源及商业化产品。Elastic 拥有 Elastic Search 完全的版权,而 StarRocks 是完全不同的情况。
在这一点上 Apache Doris 也做出了回复 —— StarRocks Fork 的是 Apache Doris ,这身份已经本末倒置了,请问 DorisDB 是否有回馈上游?这不仅不遵守基本的 Upstream First 原则,还声称要保护 StarRocks 的知识产权,这也是十分双标了。
开源许可证相关链接:
StarRocks:
https://www.dorisdb.com/en-US/product/license-FAQ
Elastic License 2.0:
https://www.elastic.co/cn/licensing/elastic-license
实际上这不是 DorisDB 的第一封“公开信”,在此前 DorisDB 也曾发布过“致 ClickHouse 用户的一封信”,被开源圈暗讽为“碰瓷营销”。
然而这一次,DorisDB 摇身一变,已经不仅仅是恶意碰瓷、在营销手段上有所不当了,而是完全无视知识产权,无视开源精神,无视开源文化。这样的肆意践踏,无论从道的层面还是术的层面都不可取。
或低调更名,或诚意道歉,这才是 StarRocks 该有的态度。
包括阿里云计算平台负责人贾扬清、腾讯云大数据产品总经理聂晶等大佬在内,来自阿里巴巴、腾讯、京东、顺丰、小米、携程、小红书、58 同城等公司的多位工程师在文内通过视频的形式为 StarRocks 站台背书,并表示愿意加入 StarRocks 社区进行贡献。
圈内相互捧场,互相支持是很正常的行为,正式开源发个视频庆祝、转个公关稿、发个朋友圈……但我们想问 ——
DorisDB 这样做,真的厚道吗?
查看 StarRocks 最近的几篇推文,我们不难发现,DorisDB 开始频频将其性能与 Apache Doris 作对比。
对此我们采访了 Apache 软件基金会董事、Apache 孵化器 PMC(项目管理委员会)吴晟,他表示:我从来不觉得一个商业公司,如果立足点仅仅是性能,能够有多么强大的生命力。我们曾经见证过无数家公司基于 Kafka 去做了所谓的性能优化,但是最后我们都知道 Kafka 背后唯一的一家上市公司其实并不是从性能角度去完成商业化的。
吴晟老师在 COSCon'19 中国开源年会的演讲上曾经说过:如果在竞争中,性能是你唯一的杀手锏,最终你一定会被对方干掉,因为所有的性能、指标都是对方可以通过更好的创新去超越的,它并不会带来碾压级的优势。
基础软件浪潮,带来了国内开源热,开源商业公司的巨额融资屡屡登上头条,慢慢开始有一些“假开源、蹭热点、刷数据、To VC”的公司出现在资本市场,我们不禁发问 —— 什么才是一家值得被看好的商业软件公司?
吴晟老师给出了他的答案 —— 合法合规、知识产权清晰、有客户愿意买单。至于开源还是闭源,其实并不重要。
特别感谢吴晟老师在假期第一时间接受我们的采访,感谢开源之商小组对这一事件的客观探讨。
我们希望以上只是我们对 StarRocks 的揣测,而非全部事实,期待听到来自 StarRocks 的回音。
我们批判的不是闭源软件,也不是商业化本身,而是对商标权,版权,知识产权,和开源文化的亵渎,不实事求是的精神。
我们呼吁鼎石公司可以正视其长期侵权行为,并对 Apache 软件基金会、Apache Doris 及原 DorisDB 的用户、客户、开发者和公众做出公开解释和道歉。
我们期待看到 Apache Doris 团队可以更好地迭代产品、繁荣社区、保持优势,SegmentFault 思否愿意长期义务支持开源项目发展。
我们依旧相信开源文化和知识产权意识在国内的觉醒,也祝福 StarRocks 无论是开源还是闭源发展,都可以走出一条有特色、合法合规的阳光大道,基业长青。