临近年末,开源领域“火力全开”:华为以超过120个上游软件和多个主流开源项目的贡献值,在多个主流开源项目中排名第一;上海开发的“书生·浦语灵笔”图文混合大模型开源不到两个月,模型代码被各国开发者下载1.7万次,在线展示体验模块试用超17万次。
2021年,国家“十四五”规划明确提出支持数字技术开源社区等创新联合体发展。凭借开放、协作、共享的特点,开源已成为全球软件开发和产业创新发展的主导协作模式,通过开源开放模式加速信息产业生态共建已成为业界共识。昨天在沪举行的2023开源产业生态大会上,专家解读了开源火爆的原因,也分析了开源模式如何为数字经济发展提供强大助力。
数字经济催生新型生产方式
“从某种角度来看,‘开源’是违反传统经济学基本原理的。”中国通信院云计算与大数据研究所所长何宝宏说,经济学是关于物理世界的,底层逻辑是物质和能量;而数字经济是关于数字世界的,底层逻辑是数据和算力。
这两者有何不同?上海对外经贸大学人工智能与变革管理研究院副院长、上海开源信息技术协会秘书长张国锋教授是用喝水来类比:物理世界的资源是稀缺的,一杯水一个人多喝一口,另一个人就少喝一口;而在数字世界,一张水的图片可以同时被无数人拥有,且拥有的人越多,其价值反而越大。
数字资产不仅要解决稀缺性,还要创造稀缺性,因此其运行逻辑和传统经济系统不同。比如。在传统经济社会中,人们会将各色物品换成一般等价物,也就是货币;但在数字世界中,人们需要给数字产品打上不同编号,如NFT(非同质化代币),才能赋予其传统意义上的“价值”。
数字产品的可共享属性,造就了开源这种以开放、平等、协作、共享为主要特征的新型生产方式,也成就了互联网的繁荣。从早期的操作系统Linux,到近年来的手机终端安卓、云计算领域的Open Stack,以及AI深度学习领域的TensorFlow、PyTorch等,这些借助开源互联网而兴起的开源软件,如今又成了数字经济的基石。
“数字转型的终点是数字原生,在数字原生世界中,开源更会‘如鱼得水’。”何宝宏说。
大模型热让更多人选择开源
开源(软件)许可协议起源于上世纪70年代,它放弃了一些传统的版权许可限制,在一定条件下允许其他人使用、修改和分发自己的源代码级作品,以促进共享与合作。
不过时至今日,基于版权的“古典”开源定义正受到云计算、大数据、大模型以及生成式人工智能(AIGC)的挑战。目前,AIGC涉及的版权和开放许可还未形成广泛共识。今年3月,美国版权局发布的《AI版权认定声明及登记指引》提出,纯AIGC作品不受版权法保护。
在今年爆火的大模型领域,OpenAI公司开发的GPT-3.5、GPT-4,以及百度文心大模型,都选择了闭源。这引发了专家的担忧。比如,闭源大模型可能会加大数字鸿沟,造成大公司的数字垄断,并由此侵占普通人的数字空间话语权。
“以ChatGPT为代表的生成式大语言模型的问世,反而让更多人选择开源。”在何宝宏看来,这也是近段时间开源持续火热的原因,大模型产业需要建立在开源之上。
与OpenAI“打得火热”的微软最近又与Hugging Face达成深度技术合作。Hugging Face是一家开源模型库公司,凭借Transformers模型库和活跃的人工智能社区得到关注,被认为是开源替代ChatGPT中最具实力的一员。目前,Hugging Face上开源的人工智能模型超过28万个,涉及66个开源协议。
自2008年开始,华为就积极参与开源、融入开源、贡献开源。华为终端BG软件部总裁龚体表示,OpenHarmony在共建伙伴的持续贡献下日趋繁荣,已经成为下一代智能终端操作系统的根社区和万物互联的数字底座。截至目前,OpenHarmony已有51家共建单位,超过6200位共建者,累计代码量1亿多行,440多款软硬件产品通过兼容性测评,并在教育、金融、交通、航天、工业等多个行业落地,真正实现“上天入地”,赋能千行百业。