OpenAI 宣布推出他们的新旗舰人工智能模型GPT-4o (“o”代表“omni”)。 GPT-4o 为所有人带来 GPT-4 级别的智能,包括免费用户。它改进了文本、视觉、音频和实时交互的功能。 OpenAI 旨在减少摩擦,让所有人都能免费使用人工智能。
关键细节:
可能会让人想起电影《她》中的 人工智能角色萨曼莎
统一处理模型:GPT-4o 可以无缝处理音频、视觉和文本输入和输出。
GPT-4o 提供GPT-4 级别的智能,但速度更快,并增强了文本、视觉、音频功能
实现自然对话和实时会话语音识别,无延迟
可以从音频中感知情感并生成富有表现力的合成语音
整合视觉理解,在对话中 处理图像、文档、图表
提供多语言支持以及跨语言 实时翻译
可以从视觉中的 面部表情中检测情绪
免费用户获得GPT-4.0级别访问权限; 付费用户获得更高的限制:GPT-4o 每 3 小时最多 80 条消息,GPT-4 每 3 小时最多 40 条消息(高峰时段可能会减少)
GPT-4o可用于 API,供开发人员大规模构建应用程序
比之前的 Turbo 型号 快 2 倍、便宜 50%、速率限制高 5 倍
适用于 macOS 的 新 ChatGPT桌面应用程序发布,具有用于查询的简单键盘快捷键以及直接在应用程序中讨论屏幕截图的功能等功能。
演示了方程求解、编码辅助、翻译等功能。
OpenAI 专注于功能的迭代推出。标准 4o 文本模式已经向 Plus 用户推出。新的语音模式将在未来几周内以 alpha 版本推出,最初可供 Plus 用户使用,并计划扩大到免费用户的可用性。
“下一件大事” 的进展将在稍后公布。
GPT-4o 免费为大众带来先进的多模式人工智能功能。凭借自然的语音交互、视觉理解以及跨模式无缝协作的能力,它可以重新定义人机交互。