突发！ChatGPT API被封禁，字节跳动与OpenAI的误会待澄清

发表时间: 2023-12-18 14:28

供1000+款AI效率工具丨AIEVA.CN丨欢迎访问

AI奇点网-AI资讯特刊丨12月18日

▷公众号菜单栏点击「干货在这」◁

免费领取海量AI绘画深度教程

据外媒报道，在生成式AI竞争中处于落后的字节跳动企图“抄近道”。

该公司被曝光一直在秘密使用OpenAI的技术来改进自家大语言模型，这违反了OpenAI商用接口的服务条款。

目前，字节跳动的企业API账户已被OpenAI封停。

据悉，字节跳动利用他人产品来直接改进自家大模型的这一做法，在业内通常被视为“失礼”。虽然没有法律规定不可以这么做，但却直接违反了OpenAI的服务条款。

OpenAI的服务条款规定，该公司所提供的模型不能被用于“开发任何与OpenAI的产品和服务竞争的AI模型”。字节跳动通过微软方面购买了OpenAI API的访问权限，微软也执行与OpenAI相同的API政策。

字节跳动秘密推动“种子计划”

字节跳动被披露的内部文件证实，该公司在大模型开发的每个阶段都依赖OpenAI的API来测试自家大模型，这一计划被称为“种子计划”（Project Seed），包括训练和评估模型的表现。

参与“种子计划”的员工都深知这一行为的不良影响。

根据外媒曝光的字节跳动海外员工内部通讯聊天记录，他们讨论了如何通过「数据脱敏」来粉饰证据。

所谓「数据脱敏」，也就是对不便于公开的敏感信息进行伪装处理，常见于产品开发阶段对于个人隐私信息的处理，比如用户的姓名、电话和地址等。

外媒报道称，“种子计划”长期访问OpenAI API接口，以至于字节跳动员工的企业账户经常达到OpenAI API的最大访问上限。

内部文件显示，字节跳动在“种子计划”的早期阶段最大化地调用OpenAI API接口。

几个月前，该公司命令该团队停止使用ChatGPT生成文本。

大约就在这个时候，字节跳动自家大模型“豆包”正式上线。

虽然字节跳动已经拥有了自家的AI大模型，但是该公司继续使用OpenAI API来评估“豆包”的模型性能。

字节跳动反应

字节跳动海外发言人Jodi Seth承认，ChatGPT生成的数据在“种子计划”的早期开发中用于注解模型。

但是他强调，在今年年中时候，ChatGPT生成的数据已经从字节跳动的模型训练参数集当中删除。

他对此还回应，字节跳动从合法途径购买微软提供的OpenAI API许可，API被用于驱动海外地区的产品和功能；在中国地区，字节跳动自研的“豆包”模型用于服务中国用户。

OpenAI反应

OpenAI发言人Niko Felix发表声明，确认字节跳动的企业账户已被暂停使用。

声明中提到，所有API客户必须OpenAI的的使用政策，以确保我们的技术被用于有益于用户的一面。

虽然近期字节跳动很少调用我们的API，但我们决定在调查期间暂停了他们的账户。

OpenAI保留要求所有用户做出必要改变或永久禁用他们账户的权利。

微软反应

微软发言人Frank Shaw在一份声明中表示：

由微软Azure驱动的OpenAI API服务属于有限访问协议框架，我们制定了标准并提供算力资源，帮助客户负责任地使用大模型技术

微软有权在发现客户滥用API行为出现的时候停止他们的访问。

字节跳动最新声明

北京时间12月17日，字节跳动官方发布了一份详细声明解释关于使用OpenAI AI服务的相关情况：

公司在使用OpenAI相关服务时，强调要所有参与者遵守其使用条款，也正与OpenAI方面联系沟通，以澄清外部报道可能引发的误解。

✅今年年初，当技术团队刚开始进行大模型的初期探索时，有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。该模型仅为测试，没有计划上线，也从未对外使用。在4月公司引入GPT API调用规范检查后，这种做法已经停止。

✅早在今年4月，字节大模型团队已经提出了明确的内部要求，不得将GPT模型生成的数据添加到字节大模型的训练数据集，并培训工程师团队在使用GPT时遵守服务条款。

✅今年9月，公司内部又进行了一轮检查，采取措施进一步保证对GPT的API 调用符合规范要求。例如分批次抽样检测模型输出结果与GPT的相似度，避免数据标注人员私自使用GPT。

✅未来几天里，我们会再次全面检查，以确保严格遵守相关服务的使用条款。

截止EVA发稿前，OpenAI与微软方面暂时没有恢复字节跳动的账号访问权限。

【本文来自丨AI奇点网丨全网账号同名丨欢迎搜索关注】

AI奇点网丨提供1000+款AI效率工具丨AIEVA.CN丨欢迎访问