AI领域巨头对决:谷歌与OpenAI的竞品分析

发表时间: 2024-05-23 11:24

成年人起码要有两个“秘书”

撰稿 | 范美琪

责编 | 汤白露

排版 | 萝拉

校对 | 柚子

“「Her」的时代来临。”

OpenAI的这句宣言,预示OpenAI和谷歌在AI领域的竞争,悄然开辟新战场。

OpenAI员工社交媒体发言

继OpenAI推出AI助手模型GPT-4o之后,谷歌在I/O开发者大会上,展示了AI助手Astra和旗舰大模型Gemini 1.5 Pro。

与以往不同的是,两位AI巨头都强调了产品的AI助手功能。

据介绍,GPT-4o具有语音交互功能,可以解释和推理相机拍摄的照片,能够充当手机或电脑上的个人助理。

而谷歌发布的Astra,在GPT-4o处理静态图片之上还增加了处理视频的功能。

Astra通过摄像头识别物体

01

OpenAI“重新定义搜索”

作为谷歌的起家业务,搜索是谷歌的核心营收部门。2014年之后,谷歌一直在全球搜索业务上独占90%以上的市场份额。

面对来势汹汹的AI浪潮,谷歌快速反应,上线多款基于Gemini的产品。比如:能够快速总结搜索结果的“AI概览”功能、支持用户存储图片的AI搜索Ask Photos等。

更有价值的是,这种生成式AI对搜索的助力体现在信息整合方面,通过检索专业知识,并形成大纲、论文或调研报告。

谷歌搜索的AI总结功能

但GPT-4o凭借其能听会说的AI助手,已具有颠覆传统搜索的功能。

从OpenAI公布的信息来看,目前研发团队大部分精力放到了移动终端(手机)上,AI助手是重点训练的功能。比如,搭载多模态大模型GPT-4o的手机,可以通过摄像头识别功能实时进行语音交互。它甚至可以识别面部表情,理解用户现在是开心还是难过。

OpenAI的手机助手不仅能解决数学问题,还能推荐适合用户阅读的书籍、为用户讲睡前故事等。因此,其强大的理解和应用能力,与过去的AI助手拉开了巨大的差距。

OpenA演示AI助手功能

也就是说,用户遇到问题时,不再需要打开搜索网站,而是直接与GPT-4o语音对话,或在手机中圈出图片或视频上想要了解的东西,就能通过AI助手找出答案。

这意味着AI助手将颠覆传统搜索模式,成为新一代搜索引擎。

AI从业人士指出:

具备通用智能和多模态属性的生成式AI技术,为AI助手成为智能手机终极交互模式提供了一条可行路径。

02

谷歌私人助理,应用场景更广

或许因为OpenAI的竞争压力,谷歌也特别注重Astra搭乘在Gemini 1.5 Pro大模型上的AI助手功能。

谷歌CEO皮查伊坦言,

关于多模态信息的AI助手,要将回答时间缩短到可对话的程度,仍是一项非常艰巨的工程挑战。

最新发布的Astra不仅能像Siri、Alexa等AI助手一样进行语音交互,还借助生成式AI的特性,拥有更好的理解能力和视觉识别能力,让AI助手也能“睁眼看世界”。

“Gemini理应是你的私人AI助理——对话式的,用户友好的,有帮助的。”皮查伊说,谷歌会把 Gemini 放到 Google Message 做测试,让 Gemini 好好学习各个国家与地区的 “社交技巧和礼仪。”

与GPT-4o相比,Astra能够广泛应用于智能家居、智能办公、智能出行等多个领域,为用户提供更全面、智能的服务体验。而GPT-4o只集中于自然语言处理领域,应用场景相对较为单一。

谷歌展示Gemini多模态功能

此外,谷歌还计划用Gemini打通并链接更多Google应用。

如果这一计划实现,用户只需要对着手机说一句话,就能让AI助手在各个应用之间协作,生成想要的答案。

比如,一位父亲只需要对AI助手下达指令,就能让相册整理出女儿从小到大的成长相册,并按照时间线排列。

皮查伊称,

未来的搜索产品逻辑可能会被彻底颠覆,人们不需要一个单独的“搜索引擎”。

不难发现,谷歌和OpenAI都洞察了AI助手的巨大潜力,希望AI助手能够像真人一样与用户自然交互。

03

苹果忙于“升级Siri”

嗅到风口的不止OpenAI和谷歌。

据外媒报道,苹果正布局AI助手,并计划于6月10日发布改进版的Siri。

苹果透露,新版本的Siri将搭乘人工智能大模型,颠覆过往的“一问一答”模式,能够与用户深入聊天交互。

目前,苹果正与Google、Cohere和OpenAI 等几家公司协商,争取Siri所应用的大模型使用权。苹果和OpenAI已接近达成协议,正在敲定最终协议条款;而谷歌方面尚未达成协议,但谈判仍在进行中。

苹果计划在即将到来的WWDC大会(6月10日开幕)上宣布 iOS 18,这一系统的AI方面可能由 GPT-4o驱动。此外,苹果还将通过配备自家处理器的数据中心,在今年内提供AI的新功能。

不过,Siri的底层技术是包括一个新的生成式AI系统,该系统将赋予Siri聊天功能,而不是一次回答一个问题。从长远策略而言,苹果并非为了与OpenAI竞争。

另一边,OpenAI最大的财务支持者微软,也计划应用大模型改进语音助手功能。微软还投资了OpenAI的竞争对手Mistral AI,积极投入自身大模型的研发。

AI助手的“商战”刚开始,将重塑整个行业的竞争格局。