开源的人工智能巨兽:马斯克旗下的Grok模型

发表时间: 2024-03-18 08:19

鞭牛士报道,3月18日消息,据外电报道,埃隆·马斯克 (Elon Musk) 的人工智能初创公司 xAI 迈出了重大一步,开源了其大型语言模型 (LLM) Grok。这意味着企业家、程序员、公司和个人现在可以访问 Grok 的权重和文档,从而允许他们将该模型的副本用于各种目的,包括商业应用。

Grok-1 是一个由 xAI 从头开始训练的 3140 亿参数混合专家模型,现在可以在其 Github 页面或通过 torrent 链接下载。

Grok 在 Apache License 2.0 下发布,允许商业使用、修改和分发。但是,用户必须遵守某些要求,例如复制原始许可证和版权声明并说明他们所做的更改。Grok 拥有 3140 亿个参数,在复杂性和性能方面超越了开源竞争对手。该模型的架构融合了神经网络设计的创新方法,将 25% 的权重用于给定的令牌,以提高效率和有效性。

此前,Grok 只能通过 Elon Musk 的社交网络 X 通过 X Premium+ 付费订阅服务访问。然而,Grok 的开源并不包括其训练数据的完整语料库,也不提供对 X 上可用的实时信息的访问。用户仍然需要订阅 X 的付费版本。

Grok 被定位为 OpenAI 的 ChatGPT 和其他领先的谷歌AI的竞争对手。它以意为理解的俚语命名,被描述为模仿《银河系漫游指南》的人工智能。马斯克将 Grok 定位为比其他谷歌AI更幽默、更不受审查的替代方案,这对担心人工智能审查制度的用户特别有吸引力。

Grok 的发布也是马斯克在针对 OpenAI 的诉讼中的一种立场,指责该公司背离了其非营利协议。

Grok 的开源引起了人工智能社区的好奇和兴奋。技术专家指出了该模型的有趣特征,例如在前馈层中使用 GeGLU 及其标准化方法,包括有趣的三明治范数技术。此版本预计会给其他 LLM 提供商(尤其是竞争对手的开源模型)带来压力,以向用户证明其优势。

总体而言,Grok的开源标志着人工智能技术发展的重大举措。它为企业家、程序员和公司提供了更好的可访问性和机会,可以将这种高级语言模型用于各种应用程序。随着人工智能社区对 Grok 的探索和实验,看看它如何塑造自然语言处理和人工智能进步的未来将会很有趣。

上个月,马斯克还对 OpenAI 及其联合创始人萨姆·奥尔特曼 (Sam Altman) 和格雷格·布罗克曼 (Greg Brockman) 提起诉讼,指控其执行营利性封闭源任务而违反合同。

OpenAI 随后发表了一篇博文,声称马斯克最早在 2015 年就同意转向盈利模式。

一月份,马斯克否认了xAI 正在筹集资金的说法,称他尚未就这样做的计划进行过任何对话。马斯克去年 7 月推出了 xAI,作为 OpenAI 和其他人工智能公司的竞争对手,随后于 11 月推出了 Grok 语言模型。