国产大模型的未来之路：开源与低价的双刃剑？

发表时间: 2024-05-16 16:05

最近这周，对于国内的大模型行业而言可以说热闹非凡，先是阿里云旗下的通义千问大模型升级到2.5版本，号称“模型性能全面赶超GPT-4 Turbo，成为地表最强中文大模型。”同时同时，通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩，超越Meta的Llama-3-70B，成为“开源领域最强大模型”。紧接着腾讯宣布旗下的混元文生图大模型全面升级并对外开源，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。

就在两大巨头在大模型上纷纷亮出“大牌”后，另一个互联网巨头字节跳动也终于按耐不住了，对外发布豆包大模型，并将“便宜”作为主要卖点：使用价格只有行业平均水平的不到一折！

国产大模型扎堆“放大招”可能是偶然，但是大家的方向却是必然的：无论是开源还是低价，目的都是希望自己的大模型能够获得更多的使用，得到更广泛的应用。而这里面的关键，则是大模型是否选择开源。

开源大模型允许任何人访问和使用源代码，而闭源大模型则由单一实体控制，通常需要付费使用。与iOS（苹果研发的闭源操作系统）和Android（谷歌旗下的开源操作系统）的发展历史相似。

和多年来科技领域的发展轨迹相同，当大模型被看到是和操作系统同样重要的“基础设施”后，自然就走到了“是否开源”的这个路口。

开源还是不开源，这个纯粹是企业的选择，也各有各的判断和支持者。

但是从iOS和Android的发展来看，显然如今Android的设备和应用数量要比iOS多得多，而且在不少人看来，正是因为有了开源的Android，移动互联网才会发展到今天这个繁荣的景象。但是另一边的iOS，也并非不成功，依靠着iOS带来的持续受益，苹果已经成为了这个地球上最赚钱的科技企业。

在今年，包括阿里云的通义千问和腾讯的混元大模型，都选择了开源的方式，希望成为未来大模型领域的Android，这对于用户而言无疑是件好事，毕竟会激发更多应用使用大模型，同时基于开源大模型也会有更多的原生应用诞生，这会让大模型更快地得到应用，让更多的用户能够更便捷更广泛的把大模型用起来。

而与此同时，闭源大模型也不是没有招，字节跳动依靠低价揽客，毕竟自己生态足够大，而价格又足够低的话，顾客和用户还是会有的。而百度更是坚定的认为“使用大模型不应该只看价格，更要看综合效果”，并重申“闭源大模型+公有云”比开源大模型性能更好、成本更低。”

但是如今无论是选择开源还是闭源的大模型，都不应该忽视iOS和Android背后两个科技巨头苹果和谷歌为系统性能所作出的努力，毕竟在当年的移动互联网操作系统之争，也是像今天大模型之争一样群雄并起的：黑莓的BlackBerry 10、Palm的webOS、三星的Bada、微软的Windows Phone、诺基亚的MeeGo等等竞争对手和iOS与Android一样，在市场中有着雄心壮志，都有成为移动互联网主流的决心。但是如今看来，除了iOS和Android，就算其他操作系统背后也是巨头撑腰，也只是行业曾经的“参与者”。

所以从历史发展的进程不难看出，虽然大模型应用的趋势已经成为共识，但是谁能成为剩下来的“iOS与Android”，还要拼真正的实力。

毕竟就在各个中国大模型都在宣称已经赶超后，OpenAI“突发”官宣推出名为GPT-4o新旗舰AI模型，GPT-4o中的“o”代表“omni”，意为“全能”。OpenAI官网介绍称，GPT-4o向更自然的人机交互迈进了一步，因为它接受文本、音频和图像的任意组合作为输入内容，并生成文本、音频和图像的任意组合输出内容。而另一边，微软也紧跟着推出了Gemini 1.5 Pro，不仅面向所有人开放，上下文窗口还从100万token直接一步迈向200万，一口气能读1500页PDF。

看着行业领先的领跑者其“硬实力”，国产大模型们还是得认清自己的问题，找到合适自己的路径，否则日后也只能是那些曾经的“参与者”。

南方+记者叶丹

【作者】叶丹

南方产业观察

国产大模型的未来之路：开源与低价的双刃剑？

热门阅读

推荐阅读