谷歌与OpenAI的较量:人工智能的新战场

发表时间: 2024-05-17 17:03

近几天,科技圈最大的新闻莫过于OpenAI和谷歌这两场发布会。

24小时之内,OpenAI、谷歌这两家AI巨头相继亮剑。

5月14日,OpenAI CEO Sam Altman亲自下场造势,在20多分钟的发布会中,用全新的多模态模型GPT-4o唤醒了人们对电影《Her》中人工智能系统“萨曼莎”的幻想。

次日,谷歌宣布升级Gemini,推出“AI全家桶”,推出集成AI的搜索引擎,用AI重塑Android。它试图借此重振旗鼓,抢回AI赛道上的主动权。过去一年多里,OpenAI多次截胡谷歌,抢在谷歌之前发布新技术、产品。

无论是双方在技术上的比拼,还是OpenAI牵手苹果,都表明,OpenAI这家AI届的当红明星都对谷歌造成了前所未有威胁。

当然,手握搜索入口、安卓生态王牌的谷歌的护城河在短期内难以攻破。然而在颠覆产业格局的AI时代里,面对后浪的追赶,谷歌等科技巨头不能松懈,否者,便是一个时代的远去。

交战

尽管被OpenAI抢占了先机,但谷歌显然是有备而来。

OpenAI推出能说会道的GPT-4o,谷歌也有自己的萨曼莎——Project Astra。

“我脑海中已经有这个愿景很长一段时间了。”谷歌DeepMind的负责人、谷歌人工智能工作负责人Demis Hassabis说。这些年,他一直在思考和研究人工智能,思考如何让机器更像人。

在他的设想中,一个人工智能Agent必须能像人一样理解并对复杂灵活的世界做出反馈。它要能看到文本并且有所反应,并且必须有主动性、可被教育的而且有个性,所以能自然地,没有延迟地和它交谈。最终,这些所有的想象就成了Project Astra。“就是那个帮手,”Hassabis说,“它很有用,你已经习惯它在你需要的时候一直在那里。”

从演示视频来看,Project Astra与Hassabis的设想显然还有距离。甚至与GPT-4o相比,延迟也更高,交流仍然不够自然。但当Project Astra准确说出“眼镜在书桌上,红色苹果旁边”时,还是获得了在场观众的惊呼声。

Project Astra的出现,也被视作是对GPT-4o的正面回应。

这并非是OpenAI和谷歌的第一次正面交战。今年2月,在谷歌发布会一周后,OpenAI悄无声息抛出重磅炸弹,推出了首款文本转视频模型——Sora。尽管Sora至今未曾开放使用,仍然给整个科技圈带来了震撼。

对于OpenAI扔下的这颗炸弹,谷歌同样在开发者大会上给出反击,发布了AI媒体创作模型Veo。据介绍,Veo能够生成高质量的1080p视频,并且依托于Imagen 3这一最新的文本到图像框架。这些AI生成的视频可以持续超过一分钟,Veo还能够理解电影制作和视觉技术的专业概念,如延时拍摄等。

不仅如此,谷歌将Gemini集成到了旗下几乎所有产品之中,尤其是其优势业务——搜索,将搜索能力变得更为强大。

尽管两场发布会,一个仅有20多分钟,一个长达2小时,对两家公司而言,却是一次技术上的巅峰对决。

焦虑

两大AI巨头贴身肉搏背后,是AI厂商的商业化焦虑。

2015年,名不见经传的OpenAI在硅谷成立。彼时,它还是一家非营利机构。依靠着微软的10亿美元投资,过着扫地僧的生活。

自2022年11月,ChatGPT问世后,OpenAI一炮打响,商业化进程也不断加速。2024年4月,OpenAI的COO称,目前企业版ChatGPT的注册用户超过60万,而今年1月这一数字为15万多。

受惠于企业对AI技术的需求,消息称,OpenAI2023年年收入已过20亿美元。

在这场由ChatGPT引发的AI热浪下,国内外科技大厂纷纷坐上牌桌。

2023年2月6日,谷歌宣布推出对话式生成人工智能聊天机器人Bard,这是谷歌旗下大模型Gemini的前身;Meta则官宣发布Llama;同年3月,美国公司Anthropic推出Claude;国内公司也立马跟上,百度发布文心一言,阿里推出通义千问,华为旗下则是盘古,商汤也上新日日新。

科技大厂纷至沓来,OpenAI想要走通商业化之路,抢占先机,就必须保证其技术上的领先,不断推出新的更强大的模型。不过,目前看来,这一路径变得更加艰难。

经过一年多的发展,各厂商相继推出了对标GPT-4的大模型。

更具挑战的是,OpenAI迭代的速度开始变慢了。从第一代ChatGPT到ChatGPT的发布,OpenAI只用了4个多月。但距离ChatGPT-4发布已经过去1年多,众人期待的ChatGPT-5仍未现身。GPT-4o的确令人印象深刻,但还不足以给整个行业带来足够的惊艳。

当然,OpenAI变慢,主要受制于大模型迭代的客观规律。越大越强的模型,数据和算力需求就更高。最终,这些都转化成OpenAI的成本压力。

相比于OpenAI庞大的研发成本,超20亿美元的年收入依旧是杯水车薪。Sam Altman表示,由于构建和运行其模型的成本高昂,OpenAI仍然处于亏损状态。随着OpenAI开发更复杂的模型,预计支出将继续超过收入增长。OpenAI可能还需要筹集数百亿美元才能满足这些成本。

除了外部竞争,OpenAI还要面临“内忧”。5月15日,自去年年底“宫斗”事件之后就未曾露面的Ilya Sutskever官宣离开,表示自己已经有了下一个计划,但目前还不能透露细节。

作为OpenAI的联合创始人和首席科学家,Ilya Sutskever主导了GPT系列大模型以及DALLE系列模型的研发。尽管不曾出席GPT-4o的发布会,但在GPT-4o主页上,Ilya的名字出现在“额外领导者”一栏。Ilya Sutskever的离开,对OpenAI商业化的影响,仍然难以判断。

追赶

当技术之间的差距逐渐缩小,AI厂商之间的竞争也步入下半场。

在两场发布会上,OpenAI和谷歌默契地开始关注端侧。GPT-4o推出Mac版本应用,谷歌则用Gemini重塑Android。

中国银河证券分析认为,GPT-4o发布预示着AI Agent新一轮竞争序幕即将拉开,叠加macOS桌面版ChatGPT集成,端侧AI革命在即,此外B端企业服务市场可能会因为GPT-4o的易用性和普惠性而迎来新的增长机遇。

新的商机下,谁能抢得先机,占领更多终端,谁就能先行占有市场。

在这方面,谷歌拥有天然的优势。谷歌旗下拥有谷歌搜索、Gmail、Youtube、Chrome浏览器等一系列应用,构建了强大的生态。

相较之下,作为第一个推出大模型的公司,尽管OpenAI在AI红利之下,创下了一系列记录。其用户体量和谷歌相比,仍然有着不小差距。

Similarweb统计数据显示,ChatGPT今年4月全球访问量为18亿次,相比3月有所上升。与此同时,尽管谷歌4月的访问量相比3月有所减少,但仍达到了834.9亿次。

更不用说,谷歌还拥有Android。在今年开发者大会上,谷歌对Android Studio进行了升级,集成了更多AI功能,方便开发者调用Gemini API进行软件开发。

英伟达人工智能工作室负责人Jim Fan表示,谷歌做对了一件事,他们终于努力将人工智能整合到搜索框中。在他看来,分发是谷歌的护城河。在这一背景之下,Gemini不一定要做世界上最好的模型,就可以成为世界上使用量最多的模型。

在OpenAI和谷歌的这场战争中,谷歌拥有Android等一系列产品,而OpenAI缺一个苹果。

作为2023年手机出货量一哥,去年一年里,iPhone出货量达到了2.346亿台,市场份额为20.1%。如果OpenAI旗下大模型真能取代“Siri”,成为搭载在数亿苹果设备上的AI 智能助手,在搜索体验、效率提升上颠覆现有生态,对于OpenAI而言,或许一切将变得不同。

本文来自华尔街见闻,欢迎下载APP查看更多