人工智能领域的产品战火升级

发表时间: 2024-05-21 11:03

北京时间5月15日凌晨，谷歌举办了年度I/O开发者大会。正如外界预期，人工智能成为这次大会的核心内容。根据发布会官方统计，两个小时的开发者大会共提及“人工智能（AI）”121次。会上，谷歌发布了众多有关AI的产品和服务，AI“全家桶”的创新性如何，引发外界关注。

具体来看，谷歌对旗下的AI大模型双子座（Gemini）进行了重要升级，使其可理解的信息量翻番，谷歌还通过对数据和算法的改进增强双子座大模型的代码生成、逻辑推理和规划、多轮对话以及音频和图像理解能力。谷歌推出的AI助手Project Astra可以通过视频和音频的方式进行识别，不仅支持实时对话，还能通过视频聊天的方式与用户进行交互。同时，谷歌也发布了自己的视频生成模型Veo，可以根据文字、图片和视频的提示，生成各种风格的高质量视频，将成为Sora新的劲敌。此外，谷歌还发布了第六代Tensor处理器单元（TPU）芯片Trillium，谷歌首席执行官（CEO）桑达尔·皮查伊表示，新产品的算力表现提升了4.7倍。

谷歌此次将AI功能深度融入搜索引擎和办公领域中。发布会结束后，谷歌搜索引擎将在美国推出“AI概览”功能，赋予搜索引擎多步骤推理的能力和计划能力。双子座大模型也将接入谷歌邮件服务Gmail，不仅可以总结邮件内容，还可以根据上下文语境智能提供回复内容。在手机端，谷歌也明确将在最新发布的安卓15系统中加入双子座大模型，提供更多AI服务。

从大模型到人工智能助手，从应用再到芯片，谷歌对AI“全家桶”进行了全面升级。谷歌以搜索为核心，以安卓系统为根据地，打造全面而丰富的AI产品矩阵，同时通过升级内存容量和整体系统带宽提升TPU性能，为AI应用提供支持。

就在谷歌举办开发者大会的前一天，OpenAI举办新品发布会，推出一款名为GPT-4o的人工智能模型。与现有模型相比，它可以同时理解文本、图像、音频等，并能将其任何组合作为输入或输出。新模型甚至能够读取人的情绪，在人机交互方面的体验更为顺畅。

OpenAI和谷歌接连推出新品，两家的产品不免被人拿来比较。从发布会上看，具体产品似乎各有所长。以此次引起关注的AI助手为例，Astra的视觉理解能力较好，但在交互体验上要比GPT-4o实时演示的能力差。从整体的创新方向来看，以往OpenAI更侧重于AI技术的突破和创新，谷歌则更注重生态系统的深化与整合，不过，两家公司在技术上的差距正在缩小，而且都在努力推动AI应用于更广泛的场景。有评论认为，和GPT-4o不到30分钟的发布会相比，谷歌缺乏惊喜，但从生态和用户积累上，谷歌依然具有先天优势。随着新品接连落地应用，围绕生成式AI的竞赛也日趋激烈。

人工智能领域的产品战火升级

热门阅读

推荐阅读