文 | 硅基研究室,作者|kiki
无论是公开场合还是媒体爆料,尽管OpenAI创始人Sam Altman已多次剧透GPT-5的相关消息,但与这位创始人浮出水面的硬件、算力等野心相比,眼下最棘手的问题是—ChatGPT的一群忠实用户们,正在发现GPT-4正在变得越来越「懒」。
所谓的「变懒」指的是ChatGPT的个人用户体验。近期,在OpenAI在线论坛上,不少用户正在抱怨GPT-4性能下降,包括推理变差、响应变慢等。一位用户甚至直言:“ChatGPT已经完全无法使用了,今天我在等待答案的同时居然煮了咖啡。”
与变懒的GPT-4相比,OpenAI对外正在讲述更多的「既要又要」的商业化故事,加速变现。
一是在ChatGPT这一对话式产品上,一面寻找更多的个人用户,如几天前开放免登录使用,争抢更多的流量和数据。另一面则是面向企业端的商业化前景。ChatGPT首席运营官Brad Lightcap就在近期透露,已有60万用户正在ChatGPT的企业级产品(包括ChatGPT Enterprise和ChatGPT Team)。Brad Lightcap称,92%的财富500强公司正在以某种形式使用ChatGPT,每周有1亿人积极使用ChatGPT。二是围绕硬件、算力和全球化上的布局。
对OpenAI来说,「既要又要」是某种必然,「模型变懒」也是其加速变现和跑马圈地所带来的直接结果。只不过,对Sam Altman和他的OpenAI来说,至少在拿出GPT-5前,需要解决的问题和麻烦还有很多。
“我曾经是一名OpenAI的布道者,总是告诉大家GPT有多棒以及该如何使用它。但现在我不再推荐它,因为它已经变得很难有效使用。”一位用户近期在OpenAI在线论坛上这样写道。
一些忠实用户选择放弃使用GPT-4 图源:OpenAI论坛
今年3月中旬,在一篇名为《How to deal with “lazy” GPT-4》的帖子下挤满了OpenAI变懒的「受害者们」。他们发现在使用ChatGPT的过程中,响应速度越来越慢,且回答问题的准确性也不及预期。
一部分个人使用者对OpenAI产生不满 图源:OpenAI论坛
有的人抱怨,GPT-4没有遵循他们给出的指令,当用户需要它给出完整的代码时,GPT-4会给出带有占位符(placeholders)的截断代码。当要求它给出用于更新代码的示例时,也更容易出错。有的人则发现,ChatGPT的废话也越来越多,在被问及它的「来源」、它的背景以及它如何产生答案时,GPT-4现在变得更加难以捉摸。还有的用户更是直接吐槽起了它的响应速度:“今天我在等待答案的同时居然煮了咖啡。”
开发者抱怨GPT-4变懒 图源:OpenAI论坛
事实上,这并不是ChatGPT第一次变懒。
早在去年7月,很多用户就在社交媒体和OpenAI开发者论坛里表达了自己的不满,变懒、变笨的GPT-4出现了逻辑弱化、错误响应、难以遵循指令、只记住最近的提示等问题。今年年初,更多的投诉下,Sam Altman直接承认了GPT-4「一直在偷懒」这一事实,并表示自己「已经发布了修复程序来解决投诉」。
Sam Altman承认GPT-4「偷懒」,图源:X
眼下,这一轮的「变懒抱怨」似乎没有等来OpenAI的回复。社区之内的ChatGPT用户们正在讨论GPT-4变懒的原因以及自己寻找解决上述问题的方法。「它曾经很聪明,现在确实一个彻头彻尾的白痴」「我感觉自己被骗了」,社区内的愤怒情绪正在增加。
对于「变懒」的原因,用户甚至猜测OpenAI是不是将背后的模型偷偷换成了GPT-3.5,还有的则认为OpenAI正在将更多的精力放在其「企业级客户」上,而非「平民」上。
用户的抱怨和吐槽GPT-4性能下降其实反向印证了两点,一是目前用户对GPT-4已积累下用户心智,他们迫切希望OpenAI推出新的产品。二是,这很有可能是OpenAI发布的GPT-5的重要时机,AI天使投资人Allie K. Miller就表示:“他们(OpenAI)有用户基础,有订阅,如果他们发现用户下降,或许将发布更新版本的模型,时机是关键。”
对OpenAI来说,一个不太好的迹象是,随着GPT-4变懒,即便是它的忠实用户们,也开始寻找替代方案。
在上述抱怨OpenAI变懒的帖子下,不少用户就提到了至少在编码能力上,Anthropic的Claude Opus 3显得可靠,在实际使用的性能方面似乎也与GPT-4 不相上下。在截至3月29日的Chatbot Arena排行榜上,Claude Opus 3就打败了GPT-4,占据第一位置。
截至3月29日,Claude Opus 3打败了GPT-4, 位列第一 图源: Hugging Face
在过去人工智能的模型竞逐中,各类科技企业「追赶GPT-4」已成为共识,各类评测和跑分表中「与GPT-4对比」也成了铁律。而Chatbot Arena排行榜的来源则来自用户实打实的投票,在用户体验端Claude Opus 3暂时跑赢GPT-4,也说明了至少在个人用户眼中,OpenAI所谓的用户护城河并不牢固。
榜单之上,除了老对手Anthropic的Claude、谷歌的Gemini外,被称为「法国OpenAI」,主打MoE架构的Mistral AI 的名字也赫然在列。此前Mistral-Medium这一「中杯版」模型就因开源和强大性能十分受开发者的拥趸,而此前在2月底发布的「大杯版」Mistral Large更是直奔着OpenAI的GPT-4去,顺便还官宣了和微软的闭源合作。
前有狼后有虎,何时发布GPT-5也还未有定论,OpenAI手中余粮又还有多少?
OpenAI和Sam Altman自然也没有闲着,刚刚结束的2024年Q1,这家全球最火热的人工智能初创企业的日程表上写了三件事:一是寻找AI的下一个入口,二是更大的算力野心,三是全球化之路。
首先,寻找AI的下一个入口,也就是OpenAI野心勃勃的硬件计划。除了此前出圈的人形机器人Figure 01外,据外媒最新报道,Sam Altman正计划和前苹果设计师Jony Ive创立的一家神秘公司,推出一款人工智能驱动的个人设备,更早前,Altman领投了AI硬件初创企业Humane,OpenAI也在讨论将其名为GPT-4 with Vision的物体识别软件嵌入到Snapchat母公司Spectacles的智能眼镜中。
其次,是更大的算力计划。Altman此前在公开场合多次表明算力是掣肘模型进化的原因,AI服务器芯片数量严重不足。为了寻求更稳定的芯片供应,除了自己下场投资GPU芯片公司和成立芯片公司外,OpenAI和「最铁的盟友」微软被曝出计划砸1000亿美元建造名为「星际之门」的AI超级计算机。
不过,在硬件和芯片计划外,过去一年之中,OpenAI也还在下一盘全球化的棋局。
今年1月,Altman开启自己的韩国之旅,与韩国芯片巨头三星、SK探讨合作的可能。近期,Altman还前往日本与日本首相岸田文雄会面,并表示OpenAI正在考虑将日本作为其亚洲首个办事处。奥尔特曼在东京对当地记者表示:“看到这项技术在日本得到采用真是令人惊奇。”据「硅基研究室」不完全统计,除日本外,OpenAI目前在伦敦和都柏林分别设立了国际办事处。
不过,在GPT-5以及种种野心计划外,摆在OpenAI眼前的,还有诸多需要解决的新麻烦。
如上文提到的「模型变懒」,OpenAI究竟是继续缝缝补补旧模型,还是提早放出GPT-5的大招,还尚未确定。
另一个新麻烦则是数据问题。视频巨头YouTube就在近期开战OpenAI,其表示,如果OpenAI在未经许可的情况下使用其视频来开发文生视频模型Sora,将违反YouTube的规则。OpenAI首席技术官Mira Murati在接受采访时表示,她不知道Sora是否接受过YouTube视频训练,公司也没有透露数据来自哪里。
《纽约时报》在近期的一则报道中,揭开了OpenAI上述数据的来源。时间拨回2021年底,OpenAI需要更多的数据,为此研究人员创建了一款名为Whisper的语音识别工具,该工具可以转录YouTube视频中的音频,生成新的对话文本,尽管一些的OpenAI员工讨论了此举可能违反YouTube的规则,但最终还是转录了超过100万小时的YouTube视频。OpenAI并未立即回应上述媒体的评论。
大算力与大数据的Scaling Law奠定了OpenAI所有工作的基础。但如今,数据的获取与使用问题是包括OpenAI在内的人工智能企业必须要面临的问题,这涉及两个层面,一是商业层大公司间的竞争,更优质的用户数据决定模型的性能。二是社会层的用户隐私问题,这些科技公司必须要为用户隐私的安全性负责。
数据问题外,不可忽视的还有人们对科技公司情绪的变化。据《The Information》数据,当前人工智能初创企业估值可能正在从峰值回落,回归现实。初创公司市盈率的下降反映出人们对人工智能初创公司前景并没有想象中那么乐观。更多投资者想要知道的是,随着业务边界的拓展,当这些初创企业拿到更多的钱时,除了如何花钱外,它们如何赚钱,如何应对更激烈的竞争,这些问题显得更为重要。
对OpenAI来说,他们或许更需要回应GPT-4变懒的问题,更好的产品体验依旧是核心护城河。正如论坛内一位用户所言:“如果有更好的产品,我会像在燃烧的船上一样跳船。”OpenAI在造一艘更大的船,但它的用户此刻可能正在选择离开。
参考资料: