编辑:桃子 好困
【新智元导读】今天,OpenAI发布了具备视觉功能GPT-4 Turbo的正式版,能处理128k上下文。与此同时,GPT-4每3小时40条消息限制似乎也取消了。
趁着谷歌开大会,OpenAI果然又来定向狙击了。
谷歌前脚刚官宣一系列更新,OpenAI立马跟着抛出重大消息——
GPT-4 Turbo迎来「重大升级」!
OpenAI今天官宣称,配备视觉能力的GPT-4 Turbo已经可以通过API调用了。
最新模型有128k上下文,训练数据截止到2023年12月。同时,Vision请求也可以使用JSON模式和函数调用。
而现在,早已有开发者用上了最新的模型。
爆火全网的AI工程师Devin就是通过Vision来执行各种编码任务。
Healthifyme团队通过GPT-4 Turbo with Vision构建的应用Snap,可以对各种美食进行拍照识别,为你提供营养洞察。
还有更牛的应用Make Real,直接勾画几笔UI,就能构建出由真实代码支持的网站。
显然,新模型可以有助于简化开发人员的工作流程,创造出更高效的应用程序。
但代码能力变差了?
不过,有研究发现,GPT-4 Turbo with Vision在编码方面较差。
尤其是,新模型似乎比现有的GPT-4 Turbo preview模型更加懒惰。
代码编辑能力
Aider依靠代码编辑基准来定量评估LLM对现有代码进行更改的程度。
GPT-4 Turbo with Vision在这一基准上的得分仅为62%,是现有任何GPT-4型号中得分最低的。
其他模型的得分为63%-66%,因此这只代表了很微小的退步,与 gpt-4-0613 相比,在统计上可能微不足道。
懒惰编码
GPT-4 Turbo preview版本因在编码时「懒惰」而广受吐槽。
经常省略所需的代码,而是在注释中留下「在此实现方法」之类的内容。
def some_complex_method(foo, bar): # ... implement method here ...
新的GPT-4 Turbo with Vision模型在AIDER的重构基准上只得了34%的分数,成为所有GPT-4 Turbo模型中最懒惰的一个。
不过,有网友表示,在对新模型进行了一天的测试后,发现其并不懒惰而是更愿意输出完整大量的代码,甚至推理能力变强了。
每3小时40条消息限制取消了?
与此同时,有外媒报道称,OpenAI已经将GPT-4每3小时40条消息的使用限制,变成了根据供需情况动态调整的灵活配额」。
简单来说就是,OpenAI会根据系统当前的繁忙程度,来增加或减少用户对GPT-4的请求次数。
然而,有不少Reddit网友表示,他们才刚发了10到17条消息,就被告知已经达到了上限。
但也有很「欧」的网友称,自己不管怎么用都没有触及限额。
不管是远低于40条的限制,还是近乎无限次的使用,OpenAI最大的问题在于——不仅从来不会告诉你已经使用的次数,也不会告诉你上限到底是多少。
据推测,这一调整是为了应对ChatGPT在「免注册」之后,显著增加的使用量。
对于OpenAI而言,这种变化提供了更大的灵活性,可以更好地分配有限而昂贵的计算资源给GPT-4。
但对于用户来说,尤其是在需求高峰期,可能用着用着突然就被取消了GPT-4的使用资格……
对此,有不少网友表示:还是Claude 3香!
至少,诸如Anthropic这样的平台,会提供更清晰的使用配额,或者允许按消息计费。