每经记者:郑雨航 每经实习记者:岳楚鹏 每经编辑:兰素英
传说中的AI模型草莓(Strawberry)要落地了?
当地时间9月10日,外媒援引对草莓模型进行过测试的两位知情人士称,OpenAI计划在未来两周内将草莓作为ChatGPT服务的一部分发布。时间上比两周前所传的“秋季发布”(9月至11月)更早。
这一最新模型的定价问题也引发了外界的兴趣。此前有报道称,新模型的订阅费将高达2000美元/月,但国内有人声称已经出现200美元/月的ChatGPT Pro,并猜测称这或是在为草莓的发布铺路。然而,这一消息的真实性还无法确定。
另外,外媒的最新报道称,草莓的初始版本只能处理文本,这可能是OpenAI在越来越多的竞争压力下作出的匆忙决定。值得注意的是,这条消息曝出前三小时,OpenAI的GPT-4o和GPT-5研究负责人Alexis Conneau在X平台上宣布将离开OpenAI自行创业。
今年8月底,有外媒援引知情人士透露,OpenAI的草莓模型预计最早将于今年秋季作为聊天机器人的一部分推出。但最新消息显示,OpenAI计划在未来两周内将其作为ChatGPT的一部分推出,发布进程正在加速。ChatGPT的现有订阅者可能有机会在免费用户之前抢先使用草莓。
据外媒报道,虽然草莓将集成在ChatGPT中,但它将是一个独立选项。目前尚不清楚用户如何访问它,但有猜测显示,用户只需在ChatGPT界面的可用模型列表中选择草莓即可。
知情人士透露称,OpenAI上个月就开始专注研发草莓,并表示草莓与其他生成式AI模型的区别在于它更专注于推理:与现有模型几乎即时的回应不同,草莓模型通常需要10到20秒来考虑对任何问题或提示的回应。
根据他们的解释,草莓的额外思考有助于避免犯错,也让其更有可能知道何时需要向客户询问后续问题,从而知道如何全面回答他们的问题。这一有目的性的延迟让草莓能够以更有条理的方式处理每个查询,从而减少出错的机会。通过花时间思考,OpenAI希望草莓能够提供更好的响应质量。这意味着草莓不仅在数学问题和编码方面表现更佳,在完成更主观的商业任务方面也更好,比如说制定产品营销策略。
外媒报道同时称,草莓的定价模式也可能有所不同。
与GPT现有的免费和订阅模式不同,草莓的定价结构预计将限制用户每小时可发送的消息数量。而且,定价可能与响应速度挂钩。对于那些希望获得更快响应的用户,草莓可能还会提供更高价位的套餐。
之前报道曾透露,在OpenAI的早期内部讨论中,新模型每月高达2000美元的订阅价格已经摆在桌面上,但并没有作出最终决定。不过大部分人并不相信这一消息的真实性,只是视为OpenAI的一次营销炒作。有网友评价道,OpenAI泄露这个价格,是为了之后他们推出200美元价格时,让人们感觉占便宜了。
无独有偶,国内有人声称已经见到200美元的ChatGPT Pro,并且还体验了一下,但目前并没有新的功能,也没有新模型,唯一的区别是,GPT-4o使用次数基本等于无限。该人士猜测ChatGPT Pro会员是为草莓的发布提前作准备。但值得一提的是,该消息源给出的唯一证明图片只是一张付款页面,但从下图比较可以发现,OpenAI的付费管理页面上并不会显示银行卡的有效期。
图片来源:数字生命卡兹克(微信公众号)
图片来源:OpenAI的付费管理页面
不过,也有外媒表示,OpenAI可能会私下选择一部分人进入ChatGPT Pro的订阅行列,所以消息的真实性还无法下定论。
暂时抛开定价不谈,对于用户来讲,高额的订阅费应该匹配良好的用户体验。
但据知情人士表示,一些使用过草莓原型的人抱怨说,与OpenAI目前发布的GPT-4o相比,草莓的响应质量稍好一些,但不值得额外等待10到20秒。
而且,尽管草莓的推理能力被外界称为先进,但消息人士表示,新模型仍存在一些局限性。
一些早期测试人员报告称,尽管理论上草莓能够在用户询问简单问题时跳过思考步骤,但实践中它并不总是如此。它可能会错误地识别一个很简单的问题而导致思考过久,而OpenAI的其他模型却可以在很短的时间内反应过来。
另外,尽管草莓能够记住之前的对话,以便提供更加个性化的回应,但在实际体验中,它有时也会突然忘记。
不仅如此,外媒报道称,草莓预计发布的初始版本只能接收和生成文本,而不能接收和生成图像,这意味着它还不支持多模态。而如今发布的大多数大型语言模型都是多模态的。
外媒分析称,将草莓以纯文本形式提前发布,可能是OpenAI在越来越多的竞争压力下作出的匆忙决定。上个月,谷歌抢先推出了一款AI语音助手Gemini Live。这一新工具的灵活性十足,能够应对用户的打断和突然的主题转换。
而除了来自对手的压力,OpenAI的人员流失似乎也还在继续。
在有关草莓发布的最新消息曝出前三小时,OpenAI首席研究员、GPT-4o背后的关键人物Alexis Conneau宣布离开OpenAI。
Conneau在X上发帖称:“在@OpenAI打造#Her的奇妙旅程结束后,我决定创办一家新公司。”他还邀请那些对“创造一些神奇事物”感兴趣的人与他联系,新公司正在招聘。
图片来源:X平台
在OpenAI发布的GPT-4o的致谢名单中可以看到,Conneau具体领导了GPT-4o Audio Pre-Training、Encoders和Interruptions团队的研究工作,其中Interruptions团队的研究内容,就是让GPT-4o可以像人一样被打断的关键。
GPT-4o在5月发布时曾凭借在文本、视觉和音频方面的“全方位”功能赢得业界青睐,尤其是Her模式(GPT-4o Voice)的出现。这一模式能够使得AI模型实时响应人类的语言互动,就像是斯嘉丽约翰逊那部著名的电影《Her》一样。
不过惊艳亮相之后,GPT-4o Voice却再无音讯。而Conneau的离开,为GPT-4o Voice的前景增添了一丝不确定性。而更值得一说的是,Conneau还是GPT-5的研究负责人。
对此,有网友问道:“实话实说,如果GPT-5真的具有突破性并且具有彻底的革命性,为什么会有这么多人离开 OpenAI?”
图片来源:Reddit
除此之外,另一重量级模型Sora似乎也面临研发困境。
当地时间,9月9日,CNBC爆料称,今年2月份就官宣了的Sora模型还处于研究阶段,今年内可能无法推出。一方面是政治原因,另一方面是技术上还没有准备好。
每日经济新闻