IT之家 12 月 6 日消息,在 6 月份的 I / O 开发者大会上,谷歌 CEO 皮查伊首次透露 Gemini 的存在,现在正式面向公众推出。谷歌表示,这是其迄今为止功能最强大、最通用的大语言模型。
根据谷歌给出的基准测试结果,Gemini 在许多测试中都表现出了“最先进的性能”,甚至在一些基准测试中完全击败了 OpenAI 的 GPT-4。
谷歌针对不同场景发布了三种不同版本:Gemini Ultra、Gemini Pro 和 Gemini Nano。这些不同的版本也将适用于不同的场景和案例:
Gemini Ultra - 用于处理高度复杂任务的最大和最强大的模型。
Gemini Pro - 用于扩展各种任务的最佳模型。
Gemini Nano - 用于设备上任务的最高效模型。
从 12 月 13 日开始,开发者和企业客户将可以通过 Google AI Studio 或 Google Cloud Vertex AI 访问 Gemini Pro 的 Gemini API。
Gemini Ultra 目前只提供给被邀请的客户、开发者、合作伙伴以及安全专家进行早期实验和反馈,并计划于明年初向开发者和企业客户推出。
Gemini Ultra 的性能在 32 个广泛使用的学术基准测试中有 30 个都表现出了超越当前时代的“先进结果”,而这些基准测试也是当前 LLM 领域最常用、最泛用的测试。
其中,Gemini Ultra 以 90.0% 的得分成为第一个在 MMLU(大规模多任务语言理解)上超越人类专家的模型,该测试结合了数学、物理、历史、法律、医学和伦理等 57 个学科。
Gemini Ultra 还在新的 MMMU 基准测试上实现了 59.4% 的领先级成果,该测试涵盖了“需要深思熟虑的”不同领域的多模态任务。
谷歌表示,其 Bard 将借助 Gemini Pro 版本进行更高级的强化,涉及逻辑推理、规划和理解等功能。它将在超过 170 个国家和地区提供服务,并计划在未来扩展到不同的模态,并支持更多语言和地区。
此外,明年初将推出全新升级的 Bard Advanced,让用户可以更好地体验到其最好的模型和功能,也就是 Gemini Ultra。
据介绍,Android 开发人员还将能够借助 AICore(IT之家注:一种在 Android 14 中提供的全新系统功能)构建 Gemini Nano,终端设备则将率先支持 Pixel 8 Pro 系列机型。
在接下来的几个月里,Gemini 将应用于更多的产品和服务,例如搜索、广告、Chrome 和 Duet AI 等等。