AI新兴企业Mistral发布281GB模型,对抗OpenAI等行业领头羊

发表时间: 2024-04-11 07:47

鞭牛士报道,4月11日消息,据外电报道,法国人工智能初创公司 Mistral 周二发布了 Mixtral 8x22B,这是一种新的大型语言模型 (LLM),也是其在人工智能领域与大佬们竞争的最新尝试。

据 Gigazine 报道, Mixtral 8x22B 预计将优于 Mistral 之前的 Mixtral 8x7B LLM,后者本身也显示出超越 OpenAI 的 GPT-3.5 和 Meta 的 Llama 2 的迹象。

新的 Mixtral 模型拥有 65,000 个文本窗口,这是指人工智能模型一次可以处理和引用的文本量。

此外,Mixtral 8x22B 的参数大小高达 1760 亿个,这是模型用于做出决策或预测的内部变量数量的参考。

Mistral由 Google 和 Meta 的研究人员创立,其人工智能模型采用开源方法。在这种情况下,Mixtral 8x22B 可供任何人下载 281GB 文件后使用。要自己执行此操作,只需粘贴Mistral AI 的 X 帖子中的磁力链接即可 到您最喜欢的 BitTorrent 客户端即可。

Mistral最新的发布正值人工智能行业新的创新模型的繁忙时期。

周二,OpenAI发布了 GPT-4 Turbo with Vision,这是最新的 GPT-4 Turbo 模型,具有视觉功能,可处理用户上传的照片、绘图和其他图像。

同一天,Google向开发人员发布了先进的 Gemini Pro 1.5 LLM,提供免费选项,每天最多可处理 50 个请求。 Meta也不甘示弱,透露其Llama 3型号将首次亮相将于本月晚些时候首次亮相。

Mixtral 8x22B 和其他模型被称为前沿模型,可以处理各种任务和请求。它们让人想起狂野的西部,旨在以更先进的技术击败以前的型号,也让人联想到危险感。在 2023 年 7 月的一篇博客文章中,OpenAI 描述了前沿模型的风险。

OpenAI 写道:前沿人工智能模型带来了明显的监管挑战:危险的功能可能会意外出现;很难强有力地防止已部署的模型被滥用;而且很难阻止模型的功能广泛扩散。行业自律是重要的第一步。然而,需要更广泛的社会讨论和政府干预来制定标准并确保遵守这些标准。

据《卫报》报道,Mistral的开源方法也受到了一些批评。通过允许任何人下载并构建其人工智能模型,这家初创公司无法阻止其系统被用于有害目的。此外,如果出现某些需要解决的缺陷或偏差,这些模型就无法离线。