Stack Overflow联手OpenAI,共同打造数据驱动模型

发表时间: 2024-05-07 00:15

OpenAI 正在与软件开发者问答论坛 Stack Overflow 合作,以提高生成式人工智能模型在编程相关任务中的性能。两家公司表示,通过周一宣布的合作,OpenAI 的模型(包括通过其 ChatGPT 聊天机器人平台提供的模型)在回答与编程相关的问题方面会随着时间的推移而变得更好。与此同时,Stack Overflow 将受益于 OpenAI 在 Stack Overflow 平台上开发新的生成式人工智能集成的专业知识。第一批集成后的模型将于 6 月底上线。

与 OpenAI 的合作对于 Stack Overflow 来说是一个显著的逆转,该公司最初因担心产生垃圾回复而禁止 ChatGPT 在其平台上进行回复。

Stack Overflow 于去年 4 月开始尝试人工智能生成功能,并承诺制作模型来"奖励"为平台贡献知识的用户。今年 7 月,该公司推出了一款对话式搜索工具,让用户可以根据 Stack Overflow 超过 5800 万个问题和答案的数据库提出查询并获得答案,同时还为企业提供了工具,以便对其自身文档和知识库的搜索进行微调。

Stack Overflow 开发者社区的一些成员对这一变化表示反对,他们对人工智能生成的信息的有效性、信息过载以及平台上个人贡献者的数据隐私表示担忧。

这些担忧至少有一定的依据。GitClear 对过去几年中提交到项目仓库的超过 1.5 亿行代码进行了分析,发现生成式人工智能开发工具正在导致更多错误代码被推送到代码库中。在其他地方,安全研究人员也警告说,这类工具会放大软件项目中现有的漏洞和安全问题。

不过,尽管存在明显的缺陷,开发人员正在接受生成式人工智能工具来完成至少某些编程任务。在 2023 年 6 月的一次 Stack Overflow民意调查中,44% 的开发人员表示,他们现在在开发过程中使用人工智能工具,26% 的开发人员计划不久后使用。

这给 Stack Overflow 带来了生存危机。据报道,自从去年发布了功能强大的新生成式人工智能模型(这些模型在很多情况下都是根据 Stack Overflow 的数据训练出来的)后,该平台的流量大幅下降。

因此,在削减成本的同时,Stack Overflow 正在寻求与人工智能供应商签订许可协议。

此前,Stack Overflow 曾与Google合作,利用 Stack Overflow 的数据丰富Google的 Gemini 模型,并与Google合作为其平台提供更多人工智能功能。Stack Overflow 当时强调,该协议并不具有排他性,而事实也确实如此。

"Stack Overflow 是世界上最大的开发者社区,"Stack Overflow 首席执行官 Prashanth Chandrasekar 今早在一份新闻稿中说。"通过与 OpenAI 建立行业领先的合作伙伴关系,我们努力重新定义开发者体验,通过社区的力量、一流的数据和人工智能体验来提高效率和加强协作。我们与 OverflowAPI 合作的目标,以及我们推动人工智能社会责任时代的工作,就是要通过经过审核、可信和准确的数据制定新的标准,这些数据将成为构建技术解决方案并将其交付给用户的基础。"