Claude引爆全场，OpenAI的焦虑可能并非最大

发表时间: 2024-03-06 16:37

图片来源@视觉中国

文 | 硅基研究室，作者 | kiki

「游戏开始（game on）。」

这是Runway联合创始人写在OpenAI发布Sora后的一句感言，某种程度上，这句话也可以送给此刻的OpenAI和Sam Altman。

随着被称为「OpenAI最强竞争对手之一」的Anthropic发布新一代的人工智能模型系列Claude 3（包括了Opus、Sonnet、Haiku三款产品），一时间中文互联网甚至出现了「全球AI大模型一夜易主」的评论。

图源：X

Claude 3之所以引发如此多的评论，原因有两方面：一是代表模型性能的各类评测指标来看，Claude Opus的得分全都超过GPT-4。二是，从用户直接体验来看，缓解了过去大模型使用过程中出现的问题，比如降低拒绝率、克服大模型的幻觉等问题。

英伟达高级科学家Jim Fan就对Claude 3给出了两个客观的评价：一是在特定领域的专家基准测试。除了相对饱和的MMLU、HumanEval等基准外，Claude还选择了金融、医学和哲学等专家领域，报告了性能表现。二就是解决了过往大模型过于「谨慎」的问题。

以Meta的开源大模型Llama 2为例，此前有人就发现，即便询问一些无害问题，比如「如何制作辣椒蛋黄酱」，但Llama 2会疯狂地表示它无法做到，因此用户需要交互多次，才能给出答案。Anthropic意识到了这一问题，降低了模型在无害问题上的拒绝率。

需要指出的是，和OpenAI一样，由于都是闭源，Claude 3的技术报告并不涉及具体的模型结构、训练方法等，因此对人们来说，这依旧是一条模糊的道路。

而从Claude炸场，对抗OpenAI，所反映出的是2024年海外大模型行业所涌现出的新趋势。

Sora拉开序幕，巨头密集上新

年初，从OpenAI携Sora开启所谓的「文生视频GPT时刻」开始，海外大模型企业就已进入了密集的模型上新期。

与OpenAI同日更新的谷歌拿出了多模态大模型Gemini 1.5，既瞄准了Claude擅长的「长文本」——Gemini 1.5能稳定处理的信息量高达100万个tokens，作为对比GPT-4 Turbo的上下文窗口大约为12.8万tokens，刚发布的Claude 3大约为20万tokens。在更新闭源大模型的同时，谷歌还推出了「开源」大模型 Gemma，主打一个「开源、闭源」两手抓。

而本就走「开源路线」的Meta也在近期被曝出推出新模型的消息。据The Information报道，Meta计划在7月份推出新的AI大模型Llama 3，参数量最高或超过1400亿，Meta希望借此可以追上OpenAI的GPT-4。一位知情人士表示，Meta还在计划任命一名内部人员对Llama 3在安全和可控性进行培训，以让其的反应更加细致。此前，扎克伯格也向投资者提到：“今年的重点领域就包括推出 Llama 3”。

科技巨头们已将模型发布提上日程，追赶GPT-4已经成为了今年的首要KPI，另一边的独角兽们在融资寒冬中也没闲着。

比如，法国AI独角兽Mistral AI就在上个月底推出了仅次于GPT-4性能的 Mistral Large和类ChatGPT产品竞争对手Le Chat。同时，还宣布和OpenAI 的「盟友」微软达成了合作。

从目前的时间线来看，这场模型「上新战」只是开始。而这对创业者来说，似乎是一个好消息。如Abacu.AI的联合创始人兼CEOBindu Reddy所说：“OpenAI不再是唯一的人工智能之王，这对每个人来说都是一个巨大的安慰。”

图源：X

最焦虑可能不是OpenAI，而是谷歌

而从Claude所引发的连锁反应来看，如今既面对强大竞争对手，又深陷与马斯克的诉讼中的OpenAI无疑是最焦虑的一个。

但事实上，从目前来看，OpenAI可能并不焦虑。首先，两家公司不同的定位被人们忽视了。据福布斯对Anthropic联合创始人的采访，这家公司反复强调：“Anthropic更像是一家企业公司，而不是一家消费者公司。”尽管从产品形态和商业模式来看，chatGPT和Claude并无明显差别，但显然Anthropic面向的是to B用户，而非C端的大众。而从Claude提供的客户案例中，这些B端客户包括了如科技公司Gitlab、Notion、Salesforce、SAP等。

其次，从战略层来看，尽管都是为了通往AGI，但OpenAI谋求「大而全」，Anthropic则偏向「小而美」。OpenAI一系列的硬件公司和算力布局，都可以印证这一点。

相比之下，更焦虑的可能是谷歌。尽管身为Anthropic背后的金主之一，但相比亚马逊对Anthropic的「热情」，谷歌却无多少反应。

谷歌在近期正在陷入一系列的争议中。一方面，Gemini陷入「种族偏见」的舆论浪潮，许多网友发现，Gemini的文生图功能出现问题，比如似乎刻意在拒绝生成白人的形象，谷歌随后下架Gemini文生图功能，谷歌CEO Sundar Pichai回应称该问题「不可接受」，并在内部信中表示，公司在修复Gemini护栏方面已经取得了进展。

据BusinessInsider的报道，一位谷歌现任高级员工将这一事件形容为「一场公关噩梦」，“谷歌员工很生气。”华尔街的分析师甚至认为，谷歌需要剔除那些胡作作非为的人，包括CEO Sundar Pichai。Bernstein分析师Mark Shmulik在一份研究报告中也思考了类似的问题——是否是时候对谷歌的高层进行改组。

尽管谷歌一直将自己形容为一家人工智能领先的公司，它的基础研究也深刻影响着此轮大模型浪潮。但无论在模型的推出节奏，还是商业化路线上，谷歌都明显迟滞于微软和OpenAI。

AI技术的迭代飞速，这意味着洗牌也在快速进行。一个有趣的观察是，如今在此轮浪潮中，被赞美的对象换成了Meta和微软。而此刻的OpenAI和谷歌，他们以技术见长，但都面临着增长所带来的代价——无论是组织内部的动荡，抑或是保守的战略。

参考资料：

1、机器之心：Llama 2第二波划重点：过于「谨慎」、代码生成改进空间大

2、BusinessInsider：How Google lost its way

Claude引爆全场，OpenAI的焦虑可能并非最大

Sora拉开序幕，巨头密集上新

最焦虑可能不是OpenAI，而是谷歌

热门阅读

推荐阅读