李彦宏最新言论引发大模型开源与闭源热议

发表时间: 2024-07-05 07:28

【文/观察者网吕栋】

“2023年国内出现了百模大战，造成了社会资源的巨大浪费，尤其是算力的浪费，但是也使得我们追赶世界上最先进的基础模型的能力得到了建立。”7月4日，百度创始人、董事长兼首席执行官李彦宏在2024世界人工智能大会（WAIC）主论坛上说道。

演讲中，李彦宏再度提及开源与闭源大模型，并称开源大模型在学术研究、教学领域等特定场景下有存在的价值，但并不适用于大多数应用场景。“当你处在激烈竞争的环境中，需要让业务效率比同行更高、成本比同行更低，这时，商业化的闭源模型是最能打的。”

他这番论述，也再次将大模型开源闭源的路线之争摆上了台面。但当前从技术层面来看，大模型开源好还是闭源好，其实并没有定论。唯一能确定的是，不同观点背后基本都是由各自的商业利益驱使。

2024世界人工智能大会现场图源：观察者网

大模型开源好还是闭源好？

今年以来，开源和闭源模型持续成为争议性话题，甚至引发了大模型公司之间的论战。

李彦宏在会上直言，“有些外行”甚至混淆了模型开源和代码开源的概念，“模型开源只能拿到一堆参数，还要在做SFT（监督微调）、安全对齐，即使是拿到对应源代码，也不知道是用了多少比例、什么比例的数据去训练这些参数，无法做到众人拾柴火焰高，拿到这些东西，并不能让你站在巨人的肩膀上迭代开发。”

他认为，同样参数规模下，开源模型能力不如闭源。“如果开源想能力追平闭源，它需要有更大的参数规模，这意味着推理成本更高、反应速度更慢。很多人拿开源模型做改款，以为这样可以更好地服务自己的个性化需求，殊不知这就变成一个孤本模型，既无法从基础模型的持续升级中获益，也没办法跟别人共享算力。”

这些观点，再度展现出李彦宏对闭源大模型的力挺，但行业对此并不是一呼百应，甚至提出了反对意见。

百度集团董事长李彦宏

去年底，阿里云首席技术官（CTO）周靖人表示，只有真正从心底去拥抱开放的生态，去促进开发者社区的发展，才能将我们的技术融入到各行各业，最终帮助整个核心技术的突破和创新。今天AI的发展，一定不是由一家公司完成的。不管谁有最强的模型，如果没有开放的技术和经验，是无法在各项应用场景中落地的。

今年4月在李彦宏提出“开源模型会越来越落后”之后，360集团董事长周鸿祎也公开表示反对。“开源不如闭源好？”他直言，如果没有开源文化，就不会有Linux、PHP、MySQL等众多重要的技术成果，甚至互联网的发展也会受到极大的限制。在他看来，开源不仅推动了技术的发展，更是促进了整个产业的繁荣。

当前如果单纯在技术层面看，闭源大模型在能力上确实处于领先地位，诸如OpenAI的GPT-4、Anthropic的Claude-3、谷歌的Gemini Ultra都是闭源。国内的情况也类似，华为盘古、百度文心一言、字节跳动云雀，以及月之暗面Kimi等有一定知名度的大模型，目前也基本走的都是闭源路线。

在此背景下，大模型开源好还是闭源好可能很难在行业中形成共识。而从另一个角度来看，大模型开源或闭源，可能更多是在应用场景上的分化，各家的站队也都有切身利益的考量。对整个大模型行业来说，厂商之间的唱反调，主要是着眼于自身业务发展的紧迫性，所作出的公开表态。

例如周鸿祎支持开源模型的原因可能就很简单，毕竟在如今的“百模大战”里，360相比头部几家还处于追赶者的地位，在用户规模和对业界影响力上，都逊色于文心一言、通义千问等大模型。而纵观软件行业的发展史，商业公司通过开源来获得某一赛道的领先地位，并不是没有先例可循。

2024世界人工智能大会现场图源：观察者网

与此同时，在一部分行业人士看来，开源闭源并不应该对立。

百川智能CEO王小川表示，开源和闭源并不像手机中的iOS或者安卓系统只能二选一，从tob角度开源闭源都需要。他预计，未来80%的企业会用到开源大模型，因为闭源没办法对产品做更好的适配，或者成本特别高，闭源可以给剩下的20%提供服务。二者不是竞争关系，而是在不同产品中互补的关系。

甚至李彦宏在这次大会上也坦承，开源模型在某些场景下是有价值的，“比如说一些学术研究，或者在教学领域，大家想要研究大模型的工作机制，形成理论，这个时候可能是有价值的，因为大家也经常听到，我们觉得大模型能力很强，但是不知道为什么能力强，因为背后没有理论来支持它，所以研究这个东西，用开源的我觉得没问题。”

没有应用，开源闭源都一文不值

尽管行业玩家对开源闭源的话题各执一词，但在李彦宏看来“这些都不是最重要的”。

“没有应用，光有基础模型，不管是开源还是闭源都一文不值。”他在会上直言，“很多人仍然把主要的关注点放在基础模型上，一天到晚就是跑分，刷榜，谁谁谁又超越GPT4了，OpenAI又出来Sora了，又出来GPT4o了等等。今天这个震撼发布，明天那个史诗级更新，但是我要问，应用在哪里？谁从中获益了？”

就像一直力挺闭源大模型一样，“不卷模型卷应用”，也是李彦宏老生常谈的观点。

早在一年前，他就曾公开表示，“新的国际竞争战略关键点，不是一个国家有多少个大模型，而是你的大模型上有多少原生的AI应用，这些应用在多大程度上提升了生产效率。”

“大模型本身并不直接创造价值，基于大模型开发出来的AI应用才能满足真实的市场需求。这是我们百度根据过去一年的实践，踩了无数的坑，交了高昂的学费换来的。”李彦宏今年4月重申。

2024世界人工智能大会现场百度展台图源：观察者网

从整个行业角度看，重视大模型的应用落地并没有错，但呼吁大家别再卷模型，则一定程度上反映了李彦宏对百度自身商业利益的考量，或者说是私心。

作为国内大模型行业的先行者，百度显然更想早日建立自己主导的大模型生态，并以文心一言为支点进行平台化落地。如此一来，百度肯定希望基础大模型赛道的参与者越少越好，一旦创业者都去开发AI应用而非大模型，百度的AI生态可能会更快建立起来，进而快速产生回报。

但从资本市场表现来看，AI先发优势始终在百度股价中没有得到体现。在去年2月触及161美元/股后，百度美股出现了持续的震荡下跌，目前跌至了90美元/股，这或许与投资者对百度的业绩预期有关。

摩根大通认为这是市场忽略了“生成式AI将成为百度中长期增长动力的假设”。从这个角度看，百度只有加快AI原生应用的落地步伐，在闭源大模型上走出一条赚钱路径，才能真正兑现业绩和市场预期。

由此也就不难理解，李彦宏为何一直呼吁大家别卷模型，持续为应用落地奔走呼号。

2024世界人工智能大会现场图源：观察者网

“应用其实离我们并不遥远。”

他在这次大会提及，随着基础模型的日益强大，开发应用也越来越简单了，“最简单的就是智能体，这也是我们最看好的AI应用的发展方向。制作一个好的智能体通常并不需要编码，只要用人话把智能体的工作流说清楚，再配上专有的知识库，一般就是一个很有价值的智能体了。这比互联网时代制作一个网页还要简单。”

李彦宏透露，基于基础模型的应用在各行各业和各个领域已开始逐步渗透。两个月之前，百度曾宣布文心大模型日调用量超过2亿，近期该调用量已超过5亿。“仅仅两个月，调用量发生这么大的变化，足见它背后代表了真实的需求，是有人在用、有人真的从大模型中获益了，得到了价值。”

不同时间的相似论述背后，可以看出李彦宏对大模型应用落地有些着急，但着急的肯定也不只是李彦宏和百度，还有腾讯、阿里、商汤科技、科大讯飞等等都在投入大模型的中国厂商。在大模型第一轮的喧嚣过去，各界开始理性看待大模型的发展后，如何把高投入变成高增长，成为市场对各大厂商的灵魂拷问。

这次演讲结尾，李彦宏还谈及了AI是否会替代人类工作的经典话题。

他坦言，AI目前更多是扮演Copilot的角色辅助人工作，而不是替代人，现在已经产生了一些全新的工作机会，如数据标注师、提示词工程师等。他强调，AI永远只是工具，不是人类的竞争对手，“我们构建和应用人工智能技术，是为了满足人的需求、增强人的能力，让人类的生活更美好。”

本文系观察者网独家稿件，未经授权，不得转载。

李彦宏最新言论引发大模型开源与闭源热议

热门阅读

推荐阅读