4月11日晚间,百度董事长兼首席执行官李彦宏的一则内部讲话流出。
内部讲话中李彦宏首次谈到文心大模型不开源的原因,称模型开源的意义不大,他认为闭源才有真正的商业模式,才能聚集人才和算力。
此外李彦宏也谈到了AI创业相关的话题,他表示,创业者真正的优势应该是在某一个领域的知识、数据,大模型也一样,有领域知识才能提供独特价值,所以没有必要担心基础模型通吃AI的应用。
“多百度一家开源不多,少百度一家也不少”
在这次内部讲话中,李彦宏首次提到了文心大模型不开源的原因。
他透露,一年前文心刚刚发布的时候,关于是否开源百度内部有过非常激烈的讨论。至于最终选择不开源的原因,李彦宏称,“当时的判断是,市场上一定会有开源的模型,而且是不止一家会开源。在这种情况下,多百度一家开源不多,少百度一家开源也不少。”
李彦宏举例称,今天看主流的开源模型,如Llama,Mistral其实都是有相当影响力的,国内的智源、百川、阿里的通义也都是开源的,“这个市场上不缺我们这一家开源的模型,我们要开源还得自己去维护一套开源的版本,这是不划算的。”
除了划算与否,另一个重要原因在于,“闭源模型在能力上会持续地领先,而不是一时地领先。”
对此李彦宏解释称,“因为我们觉得模型开源的意义其实不是很大,这些开源模型都是在外头零零散散小规模地去做各种各样的验证应用,它没有经过大算力的验证。”
他进一步解释,“而且模型开源也不是一个众人拾柴火焰高的情况。这跟传统的软件开源一比如Linux、安卓等等很不一样,由于是模型带来的开源,我们也不知道参数为什么变成了那个样子,这种情况下很难实现众人拾柴火焰高。虽然Llama也鼓励大家去贡献各种各样的数据、代码,但是实际上大家明白最主要的开发者就是Meta这些人,它并不是一个真正由大家一起来协同开发的产品。”
相反,李彦宏认为闭源才有真正的商业模式,才能聚集人才和算力。“比如硅谷有一个优秀的人才,他有OpenAI的offer,有Meta的o ffer,有Llama的offer,他会去哪儿?这是非常显而易见的选择。”
在李彦宏看来,相比开源,闭源在成本上也具有有优势。“只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。”
他还称,同等参数的情况下,闭源模型的能力也是更强的。“今天不管是在中国也好、在美国也好,最强的基础模型都是闭源的,而各种各样的小模型,都是通过大模型‘蒸馏’来的。通过大模型降维做出来的模型就是更好的,这样也会导致闭源在成本上、在效率上也会有优势。”
基础模型不会通吃AI应用
李彦宏认为,外界一些做模型的创业公司讲的所谓的“双轮驱动”不是一个好的模式。既做模型又做应用,势必会分散精力。创业公司的精力和资源都是有限的,同时做两件事情和只做一件事情哪个成功率更高是不言自明。在任何情况下我们都非常讲专注力,“力出一孔”,当资源有限的时候更应该专注,而不是去搞所谓的“双轮驱动”。
在李彦宏看来,对于AI创业者来说,核心竞争力本就不应该是模型本身,这太耗资源了,而且需要长时间的坚持才能跑出来。
创业者真正的优势应该是在某一个领域的知识、数据。假如说你今天想找一个“黄色的无兜的男士泳裤”,你在任何一个今天的电商平台上都找不到,这种需求目前的技术是解决不了的,大模型如果有领域知识就可以解决,这就是靠领域知识能够提供独特价值的例子。
市面上有这么多模型,大的、小的、开源的、闭源的,在特定应用当中怎么样使用这些模型的组合,是有技巧的,这是创业者可以干的事儿,是可以提供价值增益的。
李彦宏还谈到,外界担心如果用了文心或者闭源模型,做得好了它就抄你,就把你的饭吃掉了,实际上这种担心也是没有任何道理的。
他以拼多多、滴滴、微信举例称,在移动时代,微信没有去吃掉拼多多,滴滴也没有变成腾讯的一部分,它们都各自提供了自己独特的价值,有自己非常不一样的竞争力,它们的兴起都是依赖移动生态里的一个封闭平台——微信,但是它们并不怕微信去抢它的饭碗,所以没有必要担心基础模型通吃AI的应用。
本文系观察者网独家稿件,未经授权,不得转载。