微软投资“欧洲版OpenAI”,Mistral新模型挑战GPT-4,不再开源

发表时间: 2024-02-28 16:41

文|王怡宁

编辑|邓咏仪

封面来源|IC Photo

OpenAI最近可能很忙——Google前脚还没发完Gemini Pro模型,后脚又来一位新秀要同台对垒。

北京时间2月27日凌晨,法国开源大模型公司Mistral AI正式发布Mistral Large模型,从各种基准测试结果来看,都强势对标GPT-4。

这还没完。就在同一天,微软也正式宣布,与Mistral AI达成合作。

△图源:X

成立于2023年5月的Mistral AI,是近期的AI圈内当之无愧的香饽饽、新兴独角兽公司。在OpenAI转闭源路线之后,高举开源大旗,喊出“要让GenAI(生成式AI)为所有企业所用,完全开源。”的Mistral AI,也被认为是OpenAI的有力竞争者。

微软此前一直以OpenAI的坚定支持者形象出现,其AI生态系统Copilot也与OpenAI深度绑定,此次突然宣布与Mistral AI合作,让很多人感到出乎意料。

△图源:网络

而且,微软自己的AI动作丝毫没有放松的迹象,就在2月26日,微软也才宣布了自家的Copilot GPTs上线。目前的Copilot更是有OpenAI的各项最新技术加持,性能不可谓不强。

这个关头再把Mistral AI纳入麾下,这是为啥?有网友直接在评论区发问:

是现在的Copilot不够强大吗?

△图源:X

强势对标GPT-4,但这次没开源

此前,Mistral其实已经正式发布了规模更小的Mistral Small和Medium版本。这次,Mistral宣布正式推出的是超大杯版本——大模型Mistral Large。

Mistral Large在英语、法语、西班牙语、德语和意大利语中都具有原生的流利程度,对语法和文化背景有细致的理解。另外,其上下文窗口为32K,也允许用户从大型文档中精确召回信息。

根据官方数据,Mistral Large在基础测试中的表现出色,以81.2%的分数超越了谷歌Gemini Pro、GPT-3.5、Meta Llama 2-70B三款模型,成为仅次于GPT-4、世界第二大可通过API访问的AI大模型。

△图源:Mistral AI

不仅如此,Mistral AI还宣布要推出名为Le Chat的聊天助手,不过这个产品仍在测试当中。

据科技媒体TechCrunch,Mistral AI的商业模式也越来越像OpenAI——通过付费API提供Mistral Large,并基于使用量定价。目前,查询Mistral Large每百万个输入token的费用为8美元,每百万个输出token的费用为24美元。和GPT-4的32k版本相比,Mistral Large便宜5到7.5倍左右。

智能涌现此前也报道过这家来自法国的明星独角兽公司。Mistral AI成立于2023年5月,公司创始人团队来自DeepMind和Meta等研究团队,很多创始成员,也是为大模型领域基础技术做出关键贡献的人才。

在成立半年后,这家仅仅20人规模的公司就筹集了3.85亿欧元(约4.15亿美元),估值达20亿美元。

△图源:Mistral AI

支持其高估值的,是Mistral AI强大的模型表现。

2023年11月,Mistral AI推出的开源MoE模型Mixtral8x7B,就曾引起AI界的广泛讨论。Mixtral8x7B采用小模型组合,跑分全面超越GPT-3.5,更在多个跑分上超过了Llama2 70B,并且推理速度还是后者的6倍,在当时就被称为被称为“最强小模型”。

此时正值在OpenAI转闭源路线后,Mistral AI亮眼的数据表现和专攻小模型的路线,一度让杨立昆(Yann Lecun)等领军人物为其站台,也盛赞其是“开源希望”。

但现在,Mistral AI是否还是开源路线的扛把子,得打个问号。

这次,Mistral AI发布的Large模型就没有开源,还悄悄在官网把所有有关开源社区义务的内容全部撤掉了,让不少网友怀疑——Mistral AI是否也要走上OpenAI开源转闭源的老路?

△Mistral AI删除官网上的开源承诺。图源:X

对此,Mistral的CEO对外回复表示,团队未来依然会坚持开源理念,同时也会推出更强大的闭源模型参与商业竞争。目前,开源模型包括“Mistral 7B”、“Mistral 8 x 7B”都是以模型规模命名的,而基于商业化考量的模型则以“大中小”的方式来命名。

鸡蛋不放在一个篮子,微软:我全都要

无论模型层的厂商们打得怎么难舍难分,现在渔翁得利的,是手握OpenAI和Mistral AI两枚大将的微软。

事实上,此前微软就表现出了对Mistral AI的欣赏和兴趣。

2023年11月,在微软的Ignite大会上,微软就公布了将Mistral 7B集成到Azure AI模型目录中的消息。Mistral AI在技术上稳定持续的优异表现也吸引了微软推动合作的深入。

而对本次的合作,微软反复突出的一点是:此次合作是对两家公司的双赢选择。

此后,双方的深度合作将围绕三方面来展开:

算力:微软将通过Azure AI超级计算基础设施支持Mistral AI,为Mistral AI旗舰模型的AI训练和推理工作负载提供一流的性能和规模。

渠道合作:和OpenAI的合作模式一样,微软自家的模型即服务 (MaaS) 也将会向微软的全球客户提供Mistral AI的高级模型。

人工智能研究和开发:微软和Mistral AI将探索围绕为特定客户(包括欧洲公共部门)培训特定目的模型的合作。

简言之,双方达成深度合作后,Mistral AI能够利用Azure的尖端人工智能基础设施,加快其下一代大型语言模型的开发和部署。另外,双方的合作也可以帮助这家来自巴黎的独角兽公司加速拓展全球市场。

不过,微软此举也让不少网友疑惑,微软与OpenAI之间的合作关系是否出现重要转折?

此前,微软曾大手笔投资OpenAI,甚至两家公司的CEO还曾多次为对方站台,Sam Altman此前能够在公司内乱中成功回归重掌大权,也离不开微软在背后的强力支持和斡旋。

△微软CEO 纳德拉为OpenAI Dev Day站台

但想要不断扩大业务规模的两家公司,势必会面临从合作到正面竞争的关系。福布斯此前就预言,2024年AI圈的十大事件之一,将是微软与OpenAI“蜜月期”的结束。

鸡蛋也不能只放在OpenAI一家篮子里。微软不仅仅在自家模型上提供了多元化的选择,自己也在开发新的小模型。

1月24日,据The information就援引两位知情人士透露,微软正在组建新的GenAI团队,将专注于开发更小的语言模型(SLM) 。新团队将由微软公司副总裁Misha Bilenko和首席技术官Scott领导,微软还将数名顶级人工智能开发人员从其研究团队调至新的GenAI团队,其中包括微软研究院首席研究员Sébastien Bubeck。

2023年12月中旬,微软发布了只有27亿参数的小模型Phi-2。在规模上下功夫,有效降低使用大模型的成本。这也是微软与Mistral AI目标上的一致之处。

很多举措都显示,微软不仅要在Copilot中为用户提供最好的技术服务,比如OpenAI的ChatGPT、DALL·E3和Sora,更要努力摆脱对单一公司的依赖。

模型之外,微软在AI时代的版图,还在持续布局中。

就在2月20日,The information援引一位知情人士透露,微软正在开发一种网卡,作为英伟达网卡的替代品,以确保数据在其服务器之间快速传输。除了节省资金外,微软还希望新的网络设备能改善其英伟达芯片服务器的性能。此前,微软已经开发了自己的Maia AI服务器芯片,今年将安装在数据中心。

△图源:微软官网

2月21日,微软又宣布和英特尔达成了一项数十亿美元的芯片交易,让后者为其代工生产定制芯片。彭博社也指出,微软一直在计划为处理器和人工智能加速器进行内部设计。

欢迎交流