【文/观察者网 吕栋】
“2023年国内出现了百模大战,造成了社会资源的巨大浪费,尤其是算力的浪费,但是也使得我们追赶世界上最先进的基础模型的能力得到了建立。”7月4日,百度创始人、董事长兼首席执行官李彦宏在2024世界人工智能大会(WAIC)主论坛上说道。
演讲中,李彦宏再度提及开源与闭源大模型,并称开源大模型在学术研究、教学领域等特定场景下有存在的价值,但并不适用于大多数应用场景。“当你处在激烈竞争的环境中,需要让业务效率比同行更高、成本比同行更低,这时,商业化的闭源模型是最能打的。”
他这番论述,也再次将大模型开源闭源的路线之争摆上了台面。但当前从技术层面来看,大模型开源好还是闭源好,其实并没有定论。唯一能确定的是,不同观点背后基本都是由各自的商业利益驱使。
2024世界人工智能大会现场 图源:观察者网
大模型开源好还是闭源好?
今年以来,开源和闭源模型持续成为争议性话题,甚至引发了大模型公司之间的论战。
李彦宏在会上直言,“有些外行”甚至混淆了模型开源和代码开源的概念,“模型开源只能拿到一堆参数,还要在做SFT(监督微调)、安全对齐,即使是拿到对应源代码,也不知道是用了多少比例、什么比例的数据去训练这些参数,无法做到众人拾柴火焰高,拿到这些东西,并不能让你站在巨人的肩膀上迭代开发。”
他认为,同样参数规模下,开源模型能力不如闭源。“如果开源想能力追平闭源,它需要有更大的参数规模,这意味着推理成本更高、反应速度更慢。很多人拿开源模型做改款,以为这样可以更好地服务自己的个性化需求,殊不知这就变成一个孤本模型,既无法从基础模型的持续升级中获益,也没办法跟别人共享算力。”
这些观点,再度展现出李彦宏对闭源大模型的力挺,但行业对此并不是一呼百应,甚至提出了反对意见。
百度集团董事长李彦宏
去年底,阿里云首席技术官(CTO)周靖人表示,只有真正从心底去拥抱开放的生态,去促进开发者社区的发展,才能将我们的技术融入到各行各业,最终帮助整个核心技术的突破和创新。今天AI的发展,一定不是由一家公司完成的。不管谁有最强的模型,如果没有开放的技术和经验,是无法在各项应用场景中落地的。
今年4月在李彦宏提出“开源模型会越来越落后”之后,360集团董事长周鸿祎也公开表示反对。“开源不如闭源好?”他直言,如果没有开源文化,就不会有Linux、PHP、MySQL等众多重要的技术成果,甚至互联网的发展也会受到极大的限制。在他看来,开源不仅推动了技术的发展,更是促进了整个产业的繁荣。
当前如果单纯在技术层面看,闭源大模型在能力上确实处于领先地位,诸如OpenAI的GPT-4、Anthropic的Claude-3、谷歌的Gemini Ultra都是闭源。国内的情况也类似,华为盘古、百度文心一言、字节跳动云雀,以及月之暗面Kimi等有一定知名度的大模型,目前也基本走的都是闭源路线。
在此背景下,大模型开源好还是闭源好可能很难在行业中形成共识。而从另一个角度来看,大模型开源或闭源,可能更多是在应用场景上的分化,各家的站队也都有切身利益的考量。对整个大模型行业来说,厂商之间的唱反调,主要是着眼于自身业务发展的紧迫性,所作出的公开表态。
例如周鸿祎支持开源模型的原因可能就很简单,毕竟在如今的“百模大战”里,360相比头部几家还处于追赶者的地位,在用户规模和对业界影响力上,都逊色于文心一言、通义千问等大模型。而纵观软件行业的发展史,商业公司通过开源来获得某一赛道的领先地位,并不是没有先例可循。
2024世界人工智能大会现场 图源:观察者网
与此同时,在一部分行业人士看来,开源闭源并不应该对立。
百川智能CEO王小川表示,开源和闭源并不像手机中的iOS或者安卓系统只能二选一,从tob角度开源闭源都需要。他预计,未来80%的企业会用到开源大模型,因为闭源没办法对产品做更好的适配,或者成本特别高,闭源可以给剩下的20%提供服务。二者不是竞争关系,而是在不同产品中互补的关系。
甚至李彦宏在这次大会上也坦承,开源模型在某些场景下是有价值的,“比如说一些学术研究,或者在教学领域,大家想要研究大模型的工作机制,形成理论,这个时候可能是有价值的,因为大家也经常听到,我们觉得大模型能力很强,但是不知道为什么能力强,因为背后没有理论来支持它,所以研究这个东西,用开源的我觉得没问题。”
没有应用,开源闭源都一文不值
尽管行业玩家对开源闭源的话题各执一词,但在李彦宏看来“这些都不是最重要的”。
“没有应用,光有基础模型,不管是开源还是闭源都一文不值。”他在会上直言,“很多人仍然把主要的关注点放在基础模型上,一天到晚就是跑分,刷榜,谁谁谁又超越GPT4了,OpenAI又出来Sora了,又出来GPT4o了等等。今天这个震撼发布,明天那个史诗级更新,但是我要问,应用在哪里?谁从中获益了?”
就像一直力挺闭源大模型一样,“不卷模型卷应用”,也是李彦宏老生常谈的观点。
早在一年前,他就曾公开表示,“新的国际竞争战略关键点,不是一个国家有多少个大模型,而是你的大模型上有多少原生的AI应用,这些应用在多大程度上提升了生产效率。”
“大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”李彦宏今年4月重申。
2024世界人工智能大会现场百度展台 图源:观察者网
从整个行业角度看,重视大模型的应用落地并没有错,但呼吁大家别再卷模型,则一定程度上反映了李彦宏对百度自身商业利益的考量,或者说是私心。
作为国内大模型行业的先行者,百度显然更想早日建立自己主导的大模型生态,并以文心一言为支点进行平台化落地。如此一来,百度肯定希望基础大模型赛道的参与者越少越好,一旦创业者都去开发AI应用而非大模型,百度的AI生态可能会更快建立起来,进而快速产生回报。
但从资本市场表现来看,AI先发优势始终在百度股价中没有得到体现。在去年2月触及161美元/股后,百度美股出现了持续的震荡下跌,目前跌至了90美元/股,这或许与投资者对百度的业绩预期有关。
摩根大通认为这是市场忽略了“生成式AI将成为百度中长期增长动力的假设”。从这个角度看,百度只有加快AI原生应用的落地步伐,在闭源大模型上走出一条赚钱路径,才能真正兑现业绩和市场预期。
由此也就不难理解,李彦宏为何一直呼吁大家别卷模型,持续为应用落地奔走呼号。
2024世界人工智能大会现场 图源:观察者网
“应用其实离我们并不遥远。”
他在这次大会提及,随着基础模型的日益强大,开发应用也越来越简单了,“最简单的就是智能体,这也是我们最看好的AI应用的发展方向。制作一个好的智能体通常并不需要编码,只要用人话把智能体的工作流说清楚,再配上专有的知识库,一般就是一个很有价值的智能体了。这比互联网时代制作一个网页还要简单。”
李彦宏透露,基于基础模型的应用在各行各业和各个领域已开始逐步渗透。两个月之前,百度曾宣布文心大模型日调用量超过2亿,近期该调用量已超过5亿。“仅仅两个月,调用量发生这么大的变化,足见它背后代表了真实的需求,是有人在用、有人真的从大模型中获益了,得到了价值。”
不同时间的相似论述背后,可以看出李彦宏对大模型应用落地有些着急,但着急的肯定也不只是李彦宏和百度,还有腾讯、阿里、商汤科技、科大讯飞等等都在投入大模型的中国厂商。在大模型第一轮的喧嚣过去,各界开始理性看待大模型的发展后,如何把高投入变成高增长,成为市场对各大厂商的灵魂拷问。
这次演讲结尾,李彦宏还谈及了AI是否会替代人类工作的经典话题。
他坦言,AI目前更多是扮演Copilot的角色辅助人工作,而不是替代人,现在已经产生了一些全新的工作机会,如数据标注师、提示词工程师等。他强调,AI永远只是工具,不是人类的竞争对手,“我们构建和应用人工智能技术,是为了满足人的需求、增强人的能力,让人类的生活更美好。”
本文系观察者网独家稿件,未经授权,不得转载。