最近这周,对于国内的大模型行业而言可以说热闹非凡,先是阿里云旗下的通义千问大模型升级到2.5版本,号称“模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。”同时同时,通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为“开源领域最强大模型”。紧接着腾讯宣布旗下的混元文生图大模型全面升级并对外开源,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。
就在两大巨头在大模型上纷纷亮出“大牌”后,另一个互联网巨头字节跳动也终于按耐不住了,对外发布豆包大模型,并将“便宜”作为主要卖点:使用价格只有行业平均水平的不到一折!
国产大模型扎堆“放大招”可能是偶然,但是大家的方向却是必然的:无论是开源还是低价,目的都是希望自己的大模型能够获得更多的使用,得到更广泛的应用。而这里面的关键,则是大模型是否选择开源。
开源大模型允许任何人访问和使用源代码,而闭源大模型则由单一实体控制,通常需要付费使用。与iOS(苹果研发的闭源操作系统)和Android(谷歌旗下的开源操作系统)的发展历史相似。
和多年来科技领域的发展轨迹相同,当大模型被看到是和操作系统同样重要的“基础设施”后,自然就走到了“是否开源”的这个路口。
开源还是不开源,这个纯粹是企业的选择,也各有各的判断和支持者。
但是从iOS和Android的发展来看,显然如今Android的设备和应用数量要比iOS多得多,而且在不少人看来,正是因为有了开源的Android,移动互联网才会发展到今天这个繁荣的景象。但是另一边的iOS,也并非不成功,依靠着iOS带来的持续受益,苹果已经成为了这个地球上最赚钱的科技企业。
在今年,包括阿里云的通义千问和腾讯的混元大模型,都选择了开源的方式,希望成为未来大模型领域的Android,这对于用户而言无疑是件好事,毕竟会激发更多应用使用大模型,同时基于开源大模型也会有更多的原生应用诞生,这会让大模型更快地得到应用,让更多的用户能够更便捷更广泛的把大模型用起来。
而与此同时,闭源大模型也不是没有招,字节跳动依靠低价揽客,毕竟自己生态足够大,而价格又足够低的话,顾客和用户还是会有的。而百度更是坚定的认为“使用大模型不应该只看价格,更要看综合效果”,并重申“闭源大模型+公有云”比开源大模型性能更好、成本更低。”
但是如今无论是选择开源还是闭源的大模型,都不应该忽视iOS和Android背后两个科技巨头苹果和谷歌为系统性能所作出的努力,毕竟在当年的移动互联网操作系统之争,也是像今天大模型之争一样群雄并起的:黑莓的BlackBerry 10、Palm的webOS、三星的Bada、微软的Windows Phone、诺基亚的MeeGo等等竞争对手和iOS与Android一样,在市场中有着雄心壮志,都有成为移动互联网主流的决心。但是如今看来,除了iOS和Android,就算其他操作系统背后也是巨头撑腰,也只是行业曾经的“参与者”。
所以从历史发展的进程不难看出,虽然大模型应用的趋势已经成为共识,但是谁能成为剩下来的“iOS与Android”,还要拼真正的实力。
毕竟就在各个中国大模型都在宣称已经赶超后,OpenAI“突发”官宣推出名为GPT-4o新旗舰AI模型,GPT-4o中的“o”代表“omni”,意为“全能”。OpenAI官网介绍称,GPT-4o向更自然的人机交互迈进了一步,因为它接受文本、音频和图像的任意组合作为输入内容,并生成文本、音频和图像的任意组合输出内容。而另一边,微软也紧跟着推出了Gemini 1.5 Pro,不仅面向所有人开放,上下文窗口还从100万token直接一步迈向200万,一口气能读1500页PDF。
看着行业领先的领跑者其“硬实力”,国产大模型们还是得认清自己的问题,找到合适自己的路径,否则日后也只能是那些曾经的“参与者”。
南方+记者 叶丹
【作者】 叶丹
南方产业观察