北京时间5月15日凌晨,谷歌举办了年度I/O开发者大会。正如外界预期,人工智能成为这次大会的核心内容。根据发布会官方统计,两个小时的开发者大会共提及“人工智能(AI)”121次。会上,谷歌发布了众多有关AI的产品和服务,AI“全家桶”的创新性如何,引发外界关注。
具体来看,谷歌对旗下的AI大模型双子座(Gemini)进行了重要升级,使其可理解的信息量翻番,谷歌还通过对数据和算法的改进增强双子座大模型的代码生成、逻辑推理和规划、多轮对话以及音频和图像理解能力。谷歌推出的AI助手Project Astra可以通过视频和音频的方式进行识别,不仅支持实时对话,还能通过视频聊天的方式与用户进行交互。同时,谷歌也发布了自己的视频生成模型Veo,可以根据文字、图片和视频的提示,生成各种风格的高质量视频,将成为Sora新的劲敌。此外,谷歌还发布了第六代Tensor处理器单元(TPU)芯片Trillium,谷歌首席执行官(CEO)桑达尔·皮查伊表示,新产品的算力表现提升了4.7倍。
谷歌此次将AI功能深度融入搜索引擎和办公领域中。发布会结束后,谷歌搜索引擎将在美国推出“AI概览”功能,赋予搜索引擎多步骤推理的能力和计划能力。双子座大模型也将接入谷歌邮件服务Gmail,不仅可以总结邮件内容,还可以根据上下文语境智能提供回复内容。在手机端,谷歌也明确将在最新发布的安卓15系统中加入双子座大模型,提供更多AI服务。
从大模型到人工智能助手,从应用再到芯片,谷歌对AI“全家桶”进行了全面升级。谷歌以搜索为核心,以安卓系统为根据地,打造全面而丰富的AI产品矩阵,同时通过升级内存容量和整体系统带宽提升TPU性能,为AI应用提供支持。
就在谷歌举办开发者大会的前一天,OpenAI举办新品发布会,推出一款名为GPT-4o的人工智能模型。与现有模型相比,它可以同时理解文本、图像、音频等,并能将其任何组合作为输入或输出。新模型甚至能够读取人的情绪,在人机交互方面的体验更为顺畅。
OpenAI和谷歌接连推出新品,两家的产品不免被人拿来比较。从发布会上看,具体产品似乎各有所长。以此次引起关注的AI助手为例,Astra的视觉理解能力较好,但在交互体验上要比GPT-4o实时演示的能力差。从整体的创新方向来看,以往OpenAI更侧重于AI技术的突破和创新,谷歌则更注重生态系统的深化与整合,不过,两家公司在技术上的差距正在缩小,而且都在努力推动AI应用于更广泛的场景。有评论认为,和GPT-4o不到30分钟的发布会相比,谷歌缺乏惊喜,但从生态和用户积累上,谷歌依然具有先天优势。随着新品接连落地应用,围绕生成式AI的竞赛也日趋激烈。