Claude引爆全场,OpenAI可能并非最令人担忧

发表时间: 2024-03-06 16:46

图片来源@视觉中国

文 | 硅基研究室,作者 | kiki

「游戏开始(game on)。」

这是Runway联合创始人写在OpenAI发布Sora后的一句感言,某种程度上,这句话也可以送给此刻的OpenAI和Sam Altman。

随着被称为「OpenAI最强竞争对手之一」的Anthropic发布新一代的人工智能模型系列Claude 3(包括了Opus、Sonnet、Haiku三款产品),一时间中文互联网甚至出现了「全球AI大模型一夜易主」的评论。

图源:X

Claude 3之所以引发如此多的评论,原因有两方面:一是代表模型性能的各类评测指标来看,Claude Opus的得分全都超过GPT-4。二是,从用户直接体验来看,缓解了过去大模型使用过程中出现的问题,比如降低拒绝率、克服大模型的幻觉等问题。

英伟达高级科学家Jim Fan就对Claude 3给出了两个客观的评价:一是在特定领域的专家基准测试。除了相对饱和的MMLU、HumanEval等基准外,Claude还选择了金融、医学和哲学等专家领域,报告了性能表现。二就是解决了过往大模型过于「谨慎」的问题。

以Meta的开源大模型Llama 2为例,此前有人就发现,即便询问一些无害问题,比如「如何制作辣椒蛋黄酱」,但Llama 2会疯狂地表示它无法做到,因此用户需要交互多次,才能给出答案。Anthropic意识到了这一问题,降低了模型在无害问题上的拒绝率。

需要指出的是,和OpenAI一样,由于都是闭源,Claude 3的技术报告并不涉及具体的模型结构、训练方法等,因此对人们来说,这依旧是一条模糊的道路。

而从Claude炸场,对抗OpenAI,所反映出的是2024年海外大模型行业所涌现出的新趋势。

Sora拉开序幕,巨头密集上新

年初,从OpenAI携Sora开启所谓的「文生视频GPT时刻」开始,海外大模型企业就已进入了密集的模型上新期。

与OpenAI同日更新的谷歌拿出了多模态大模型Gemini 1.5,既瞄准了Claude擅长的「长文本」——Gemini 1.5能稳定处理的信息量高达100万个tokens,作为对比GPT-4 Turbo的上下文窗口大约为12.8万tokens,刚发布的Claude 3大约为20万tokens。在更新闭源大模型的同时,谷歌还推出了「开源」大模型 Gemma,主打一个「开源、闭源」两手抓。

而本就走「开源路线」的Meta也在近期被曝出推出新模型的消息。据The Information报道,Meta计划在7月份推出新的AI大模型Llama 3,参数量最高或超过1400亿,Meta希望借此可以追上OpenAI的GPT-4。一位知情人士表示,Meta还在计划任命一名内部人员对Llama 3在安全和可控性进行培训,以让其的反应更加细致。此前,扎克伯格也向投资者提到:“今年的重点领域就包括推出 Llama 3”。

科技巨头们已将模型发布提上日程,追赶GPT-4已经成为了今年的首要KPI,另一边的独角兽们在融资寒冬中也没闲着。

比如,法国AI独角兽Mistral AI就在上个月底推出了仅次于GPT-4性能的 Mistral Large和类ChatGPT产品竞争对手Le Chat。同时,还宣布和OpenAI 的「盟友」微软达成了合作。

从目前的时间线来看,这场模型「上新战」只是开始。而这对创业者来说,似乎是一个好消息。如Abacu.AI的联合创始人兼CEOBindu Reddy所说:“OpenAI不再是唯一的人工智能之王,这对每个人来说都是一个巨大的安慰。”

图源:X

最焦虑可能不是OpenAI,而是谷歌

而从Claude所引发的连锁反应来看,如今既面对强大竞争对手,又深陷与马斯克的诉讼中的OpenAI无疑是最焦虑的一个。

但事实上,从目前来看,OpenAI可能并不焦虑。首先,两家公司不同的定位被人们忽视了。据福布斯对Anthropic联合创始人的采访,这家公司反复强调:“Anthropic更像是一家企业公司,而不是一家消费者公司。”尽管从产品形态和商业模式来看,chatGPT和Claude并无明显差别,但显然Anthropic面向的是to B用户,而非C端的大众。而从Claude提供的客户案例中,这些B端客户包括了如科技公司Gitlab、Notion、Salesforce、SAP等。

其次,从战略层来看,尽管都是为了通往AGI,但OpenAI谋求「大而全」,Anthropic则偏向「小而美」。OpenAI一系列的硬件公司和算力布局,都可以印证这一点。

相比之下,更焦虑的可能是谷歌。尽管身为Anthropic背后的金主之一,但相比亚马逊对Anthropic的「热情」,谷歌却无多少反应。

谷歌在近期正在陷入一系列的争议中。一方面,Gemini陷入「种族偏见」的舆论浪潮,许多网友发现,Gemini的文生图功能出现问题,比如似乎刻意在拒绝生成白人的形象,谷歌随后下架Gemini文生图功能,谷歌CEO Sundar Pichai回应称该问题「不可接受」,并在内部信中表示,公司在修复Gemini护栏方面已经取得了进展。

据BusinessInsider的报道,一位谷歌现任高级员工将这一事件形容为「一场公关噩梦」,“谷歌员工很生气。”华尔街的分析师甚至认为,谷歌需要剔除那些胡作作非为的人,包括CEO Sundar Pichai。Bernstein分析师Mark Shmulik在一份研究报告中也思考了类似的问题——是否是时候对谷歌的高层进行改组。

尽管谷歌一直将自己形容为一家人工智能领先的公司,它的基础研究也深刻影响着此轮大模型浪潮。但无论在模型的推出节奏,还是商业化路线上,谷歌都明显迟滞于微软和OpenAI。

AI技术的迭代飞速,这意味着洗牌也在快速进行。一个有趣的观察是,如今在此轮浪潮中,被赞美的对象换成了Meta和微软。而此刻的OpenAI和谷歌,他们以技术见长,但都面临着增长所带来的代价——无论是组织内部的动荡,抑或是保守的战略。

参考资料:

1、机器之心:Llama 2第二波划重点:过于「谨慎」、代码生成改进空间大

2、BusinessInsider:How Google lost its way