Open AI开发者大会：三大行动：升级、降价、生态拓展

发表时间: 2023-11-08 10:35

北京时间11月7日凌晨，在OpenAI首次开发者大会上，CEO阿尔特曼（Sam Altman）用45分钟的时间公布了过去一年中GPT的各项数据，以及最新版本GPT-4 Turbo的升级功能。正如“Turbo”一词的中文含义“涡轮增压器”一样，本次发布会上，OpenAI的这款最新大模型在长文本、知识库、多模态、模型控制、模型微调、高速率六大方面的功能均进行了“涡轮增压”，而价格甚至比GPT-4还要低。

“今天，有大约200万开发者使用我们的API进行开发，超过92%的财富500强公司使用我们的产品，而ChatGPT的每周活跃用户大约有1亿。”在演讲现场，阿尔特曼不得不制止观众们频频响起的掌声，“你们不用每次都鼓掌，后面的（发布）还有很多。”而在这一切的背后，是OpenAI对自己大模型能力的自信，“随着GPT-4的发布，它仍然是全世界能力最强的大模型。”

在本次大会上，阿尔特曼也显露了OpenAI打造自身生态的野心：通过构建一个大模型版本的“应用商店”（GPTStore），用户可以通过自然语言构建定制化GPT，并将其上传到应用商店获得分成收入，企业也可以在应用商店里挑选最适合自己的大语言模型。

OpenAI官网截图

升级：终于跟上长文本潮流，可输入128k提示词

在演讲伊始，阿尔特曼着重讲述了GPT-4 Turbo在六大方面的升级功能。

贝壳财经记者注意到，长文本输入功能是最近不少国内大模型公司推出的特色功能之一，如10月30日百川智能发布的Baichuan2-192K大模型上下文窗口长度为192K token（语句），号称全球最长（可以直接输入一部《三体》小说），不过这一记录在11月6日被零一万物发布的大模型Yi-34B打破，其将大模型上下文窗口长度刷新到了200K。相比之下，GP4-4的上下文窗口为32K，文字处理量约2.5万字。

而在本次OpenAI的发布中，阿尔特曼将GPT-4 Turbo的上下文窗口提升到了128K，这大约相当于300页纸的文字量。

另一个更新是大模型的知识库，此前GPT-4知识库仅停留在2021年9月，而GPT-4Turbo的内部知识库已更新至2023年4月。值得注意的是，阿尔特曼表示，GPT-4Turbo支持用户上传外部数据库或文件。

多模态能力方面，GPT-4Turbo整合了OpenAI的图像创建模型DALL·E3、新的文本到语音模型TextToSpeech、开源语音识别模型WhisperV3。

而对于大模型在同一问题或连续问题生成答案方面的随机性，阿尔特曼表示，GPT-4Turbo拥有更强的模型控制手段：一是允许一次交互同时调用多个函数，二是引入JSON模式（一种应用程序之间传输数据的方式）以简化API（应用程序接口）调用过程，三是引入seedparameter（种子限制条件）可确保模型返回固定输出。

同时，继8月上线可微调的GPT-3.5Turbo版本，本次开发者可以在GPT-4基础上进行定制化调试训练，OpenAI还表示开放Custommodels（自定义模型）接受企业的模型定制。

最后，阿尔特曼表示，GPT-4Turbo有了更高的速率限制，其开放给API的token吞吐量将提升一整倍。

降价：输入端和输出端都降价

值得注意的是，相比原版GPT-4，GPT-4Turbo的收费做了大幅下降，其输入token的收费价0.01美元，输出token的价格为0.03美元。

同时，GPT-3.5Turbo也得到了升级，新版本GPT-3.5Turbo默认支持16K，价格方面，GPT-3.5Turbo16K输入降价至0.001美元，输出降价至0.002美元，GPT-3.5Turbo微调版本输入降价至0.003美元，输出降价至0.006美元。

此外，据OpenAI公司官网，目前通过GPT-4、GPT-3.5Turbo上传750词的文档分别需要0.06、0.003美元（以最高速度计算）。这次大会上，OpenAI还发布了“有记忆功能”的内存存储AP，可以提高大模型计算速度，降低开发者的API调用成本达95%，同时其还推出了版权保护措施，为使用ChatGPT企业版和开发者平台功能的客户提供法律索赔介入和费用支付保护。

GPT-4Turbo还增加了新的多模态功能，包括视觉、图像创建（DALL·E 3）和文本转语音 (TTS)。Turbo版GPT-4 可以接受API中的图像输入，从而实现生成标题、详细分析现实世界图像、以及阅读带有图形的文档等用例。

OpenAI计划为主要的Turbo版GPT-4模型提供视觉支持。视觉输入的定价取决于输入图像的大小。例如，将1080×1080像素的图像发送给Turbo版收费0.00765美元。图像创建方面，OpenAI提供不同的格式和质量选项，每生成一张图像起售价为0.04美元。

平安证券发布研报认为，此次API体系的全线降价将降低用户的使用成本，有利于激发用户基于API的开发热情，推动AIGC技术在应用场景的进一步渗透。

生态：推出应用商店GPTStore，此前插件并不好用

另一个值得注意的事件是，本次发布会上，OpenAI再次梳理了其应用商店体系，引入了GPTs功能，即每个用户都可以通过自然语言构建定制化GPT，并将其上传到应用商店GPTStore获得分成收入。此外，OpenAI还推出了新的开发方式AssistantsAPI（接口助理），提供代码解释器、函数调用等功能，让开发人员可以更轻松地构建自己的辅助AI应用，这些应用可以调用模型和工具实现自己的目标。

这不禁让人想起了今年3月，OpenAI推出的ChatGPT插件功能。该功能刚刚推出时，曾有许多人惊呼大模型成功“联网”，将打开潘多拉魔盒。英伟达AI科学家Jim Fan甚至激动地表示，如果说ChatGPT可以看作苹果手机的出现，那么第三方插件的出现就是苹果应用商店出现了。

不过，在后续的实践中，虽然ChatGPT插件的数量在不断攀升，但这些插件并没有想象中受欢迎，在上个月的开发者会议上，阿尔特曼甚至表示，它们不符合产品市场需求。

平安证券认为，OpenAI引入GPTStore功能、推出AssistantsAPI，与开发者共享收益、优化开发模式，有望加快个性化AIGC应用开发的发展。未来，AIGC技术的进一步渗透与应用场景拓宽值得期待。

随着本次真正的“应用商店”GPTStore的出现，GPT是否会像苹果推出应用商店一样，真正迎来属于自己的繁荣生态？让我们拭目以待。

新京报贝壳财经记者罗亦丹

编辑徐超

校对柳宝庆

Open AI开发者大会：三大行动：升级、降价、生态拓展

热门阅读

推荐阅读