OpenAI选择闭源，为何反而推动了开源的发展？

发表时间: 2023-12-20 16:25

临近年末，开源领域“火力全开”：华为以超过120个上游软件和多个主流开源项目的贡献值，在多个主流开源项目中排名第一；上海开发的“书生·浦语灵笔”图文混合大模型开源不到两个月，模型代码被各国开发者下载1.7万次，在线展示体验模块试用超17万次。

2021年，国家“十四五”规划明确提出支持数字技术开源社区等创新联合体发展。凭借开放、协作、共享的特点，开源已成为全球软件开发和产业创新发展的主导协作模式，通过开源开放模式加速信息产业生态共建已成为业界共识。昨天在沪举行的2023开源产业生态大会上，专家解读了开源火爆的原因，也分析了开源模式如何为数字经济发展提供强大助力。

数字经济催生新型生产方式

“从某种角度来看，‘开源’是违反传统经济学基本原理的。”中国通信院云计算与大数据研究所所长何宝宏说，经济学是关于物理世界的，底层逻辑是物质和能量；而数字经济是关于数字世界的，底层逻辑是数据和算力。

这两者有何不同？上海对外经贸大学人工智能与变革管理研究院副院长、上海开源信息技术协会秘书长张国锋教授是用喝水来类比：物理世界的资源是稀缺的，一杯水一个人多喝一口，另一个人就少喝一口；而在数字世界，一张水的图片可以同时被无数人拥有，且拥有的人越多，其价值反而越大。

数字资产不仅要解决稀缺性，还要创造稀缺性，因此其运行逻辑和传统经济系统不同。比如。在传统经济社会中，人们会将各色物品换成一般等价物，也就是货币；但在数字世界中，人们需要给数字产品打上不同编号，如NFT（非同质化代币），才能赋予其传统意义上的“价值”。

数字产品的可共享属性，造就了开源这种以开放、平等、协作、共享为主要特征的新型生产方式，也成就了互联网的繁荣。从早期的操作系统Linux，到近年来的手机终端安卓、云计算领域的Open Stack，以及AI深度学习领域的TensorFlow、PyTorch等，这些借助开源互联网而兴起的开源软件，如今又成了数字经济的基石。

“数字转型的终点是数字原生，在数字原生世界中，开源更会‘如鱼得水’。”何宝宏说。

大模型热让更多人选择开源

开源（软件）许可协议起源于上世纪70年代，它放弃了一些传统的版权许可限制，在一定条件下允许其他人使用、修改和分发自己的源代码级作品，以促进共享与合作。

不过时至今日，基于版权的“古典”开源定义正受到云计算、大数据、大模型以及生成式人工智能（AIGC）的挑战。目前，AIGC涉及的版权和开放许可还未形成广泛共识。今年3月，美国版权局发布的《AI版权认定声明及登记指引》提出，纯AIGC作品不受版权法保护。

在今年爆火的大模型领域，OpenAI公司开发的GPT-3.5、GPT-4，以及百度文心大模型，都选择了闭源。这引发了专家的担忧。比如，闭源大模型可能会加大数字鸿沟，造成大公司的数字垄断，并由此侵占普通人的数字空间话语权。

“以ChatGPT为代表的生成式大语言模型的问世，反而让更多人选择开源。”在何宝宏看来，这也是近段时间开源持续火热的原因，大模型产业需要建立在开源之上。

与OpenAI“打得火热”的微软最近又与Hugging Face达成深度技术合作。Hugging Face是一家开源模型库公司，凭借Transformers模型库和活跃的人工智能社区得到关注，被认为是开源替代ChatGPT中最具实力的一员。目前，Hugging Face上开源的人工智能模型超过28万个，涉及66个开源协议。

自2008年开始，华为就积极参与开源、融入开源、贡献开源。华为终端BG软件部总裁龚体表示，OpenHarmony在共建伙伴的持续贡献下日趋繁荣，已经成为下一代智能终端操作系统的根社区和万物互联的数字底座。截至目前，OpenHarmony已有51家共建单位，超过6200位共建者，累计代码量1亿多行，440多款软硬件产品通过兼容性测评，并在教育、金融、交通、航天、工业等多个行业落地，真正实现“上天入地”，赋能千行百业。

OpenAI选择闭源，为何反而推动了开源的发展？

热门阅读

推荐阅读