技术路径引发热议:文心一言达到2亿用户,李彦宏预警开源模型将逐渐过时

发表时间: 2024-04-16 18:16

本文来源:时代周报 作者:申谨睿

图片由百度提供

4月16日,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上,正式宣布发布文心大模型4.0的工具版。

李彦宏表示,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。“也就是说,客户原来一天调用1万次,同样成本之下,现在一天可以调用100万次。”

李彦宏还透露,从去年3月16日首发,到今天一年零一个月的时间,文心一言用户数突破了2亿,每天API的调用量突破了2亿,服务客户数或者说企业达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。

李彦宏强调,大语言模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。他分享了基于大模型开发AI原生应用的三个思路:

一是,未来大型的AI原生应用基本都是MoE。即大小模型的混用,不依赖一个模型来解决所有问题。

二是,小模型更有效价比。小模型推理成本低,响应速度快。在一些特定场景中,经过精调后的小模型,它的使用效果可以媲美大模型。这也是今日百度同步发布ERNIE Speed、ERNIE Lite和ERNIE Tiny三个轻量模型的原因。

三是,智能体大幅降低开发门槛,可低代码甚至零代码生成AI原生应用。

李彦宏表示,智能体是当前非常热的一个话题,随着智能体能力的提升,会不断催生出大量的AI原生应用。智能体机制包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和自我进化。

“在一些复杂系统中,我们还可以让不同的智能体互动,相互协作,更高质量地完成任务。这些智能体能力,我们已经开发出来了,并且向开发者全面开放。”李彦宏称。

李彦宏介绍,因为基础模型文心 4.0 可以根据需要,兼顾效果、响应速度、推理成本等各种考虑,剪裁出适合各种场景的更小尺寸模型,并且支持精调和 post pretrain。这样通过降维剪裁出来的模型,比直接用开源模型调出来的模型,同等尺寸下,效果明显更好;同等效果下,成本明显更低,“所以开源模型会越来越落后”。

李彦宏所持观点,与不少业内人士相反。在近期哈佛大学的一次演讲中,360集团创始人周鸿祎表示:“没有开源就没有 Linux、没有互联网,甚至包括我们自己借助了开源技术才能发展至今。”他预言,在未来一到两年内,开源技术的力量很可能会超过闭源技术。

周鸿祎表示:“现在开源模型的能力达不到 GPT-4。但是专注在一个方向上,用企业内部的专有数据加上专业训练,进行能力的加强之后,它就有可能在专业能力上超过 GPT-4。”

今年3月份,金沙江创投主管合伙人朱啸虎亦表示了类似的观点:“现在开源比非开源落后一代,但长远来看,开源肯定会赶上来。”除此之外,国内处于第一梯队的大模型创业公司百川智能和智谱AI也都选择了开源的技术路线。

不过,关于闭源和开源孰优孰劣的技术路线之争,市场并没有定论。“客观来讲,2023年在国内市场上,百度在大模型上出拳的体系和章法,领先于国内其他互联网公司,可以看出它在人工智能上过往的积累。”科技分析师赵松告诉时代周报。

作为国内第一家推出聊天机器人,并开放内测硬刚ChatGPT的互联网公司公司,百度在人工智能领域具备一定先发优势。实际上,早在2019年3月,百度就对标谷歌BERT模型,推出了文心大模型ERNIE 1.0,称其中文效果超越BERT,并于2021年12月达千亿参数,迈进“智能涌现”门槛。

“百度与阿里、腾讯、华为在大模型行业处于第一梯队,是获得业内认可的‘全能型选手’。百度在大模型、大模型工具平台、大模型对自身应用的重构、大模型生态包括开发者孵化上,搭建了比较全面的体系”,赵松称:“当下,基础大模型性逐步提升,落地应用场景是国内大模型企业的难点。”

李彦宏在演讲中提到“落地”相关话题时表示:“无论是中国,还是美国,最好的AI原生应用还没有出现。”他认为,就像移动时代诞生了像微信、抖音这样的“mobile-native”的应用一样,AI原生时代一定会有新的超级应用将基于大模型开发出来。

但上述超级应用的诞生不会在短时间内骤然出现。这既需要基础大模型技术能力不断迭代,也需要越来越多开发者参与其中。