超越 OpenAI:借鉴 OpenAI 的方法

发表时间: 2024-03-05 23:57

3 月 4 日,Anthropic 发布三个版本的大模型系列 Claude 3,性能由强到弱分别是:Opus (拉丁语 “作品”)、Sonnet(英语 “十四行诗”)和 Haiku(日语 “俳句” 的音译)。


在十项常用模型能力评估数据集表现中,Opus 得分全都超过 GPT-4,视觉识别能力评估也是如此。这是 OpenAI 的 GPT-4 发布一年后,第一个评测指标全面超越它的大模型。Claude 3 的另两款模型智能水平不及 Opus,但用起来更便宜,适用需要快速响应的场景,比如 Haiku 可以 3 秒阅读 1 万字的论文。


Anthropic 成立于 2021,早期团队成员全部来自 OpenAI。Anthropic 也长期被视作最有可能与 OpenAI 竞争的公司。截至 2023 年底,Anthropic 从亚马逊、Google、Salesforce 等投资者手中筹到 70 多亿美元,融资规模仅次于 OpenAI,并且迅速补齐了算力等必需资源。


跟 OpenAI 不同,Anthropic 的目标是开发一个 “有用、诚实、无害” 的大模型,而且无害的重要性不低于有用。Anthropic CEO 达里奥·阿莫代等人当初离开 OpenAI 正是因为不满其更偏重盈利,降低了安全的优先级。


不过,在研发出更安全的大模型后,Anthropic 也不打算延续 OpenAI 最初的愿景——靠开放、开源让更多人用上好的 AI。


Anthropic 成立至今,始终没有详细公布 Claude 系列模型是具体如何训练出来的,也不打算开源。他们认为,如果没有做好充分的保护措施,开源大模型会导致滥用。