突发!ChatGPT API被封禁,字节跳动与OpenAI的误会待澄清

发表时间: 2023-12-18 14:28

供1000+款AI效率工具丨AIEVA.CN丨欢迎访问

AI奇点网-AI资讯特刊丨12月18日

▷公众号菜单栏点击「干货在这」

免费领取海量AI绘画深度教程

据外媒报道,在生成式AI竞争中处于落后的字节跳动企图“抄近道”。

该公司被曝光一直在秘密使用OpenAI的技术来改进自家大语言模型,这违反了OpenAI商用接口的服务条款。

目前,字节跳动的企业API账户已被OpenAI封停。

据悉,字节跳动利用他人产品来直接改进自家大模型的这一做法,在业内通常被视为“失礼”。虽然没有法律规定不可以这么做,但却直接违反了OpenAI的服务条款。

OpenAI的服务条款规定,该公司所提供的模型不能被用于“开发任何与OpenAI的产品和服务竞争的AI模型”。字节跳动通过微软方面购买了OpenAI API的访问权限,微软也执行与OpenAI相同的API政策。

字节跳动秘密推动“种子计划”

字节跳动被披露的内部文件证实,该公司在大模型开发的每个阶段都依赖OpenAI的API来测试自家大模型,这一计划被称为“种子计划”(Project Seed),包括训练和评估模型的表现。

参与“种子计划”的员工都深知这一行为的不良影响。

根据外媒曝光的字节跳动海外员工内部通讯聊天记录,他们讨论了如何通过「数据脱敏」来粉饰证据。

所谓「数据脱敏」,也就是对不便于公开的敏感信息进行伪装处理,常见于产品开发阶段对于个人隐私信息的处理,比如用户的姓名、电话和地址等。

外媒报道称,“种子计划”长期访问OpenAI API接口,以至于字节跳动员工的企业账户经常达到OpenAI API的最大访问上限。

内部文件显示,字节跳动在“种子计划”的早期阶段最大化地调用OpenAI API接口。

几个月前,该公司命令该团队停止使用ChatGPT生成文本。

大约就在这个时候,字节跳动自家大模型“豆包”正式上线。

虽然字节跳动已经拥有了自家的AI大模型,但是该公司继续使用OpenAI API来评估“豆包”的模型性能。

字节跳动反应

字节跳动海外发言人Jodi Seth承认,ChatGPT生成的数据在“种子计划”的早期开发中用于注解模型。

但是他强调,在今年年中时候,ChatGPT生成的数据已经从字节跳动的模型训练参数集当中删除。

他对此还回应,字节跳动从合法途径购买微软提供的OpenAI API许可,API被用于驱动海外地区的产品和功能;在中国地区,字节跳动自研的“豆包”模型用于服务中国用户。

OpenAI反应

OpenAI发言人Niko Felix发表声明,确认字节跳动的企业账户已被暂停使用。

声明中提到,所有API客户必须OpenAI的的使用政策,以确保我们的技术被用于有益于用户的一面。

虽然近期字节跳动很少调用我们的API,但我们决定在调查期间暂停了他们的账户。

OpenAI保留要求所有用户做出必要改变或永久禁用他们账户的权利。

微软反应

微软发言人Frank Shaw在一份声明中表示:

由微软Azure驱动的OpenAI API服务属于有限访问协议框架,我们制定了标准并提供算力资源,帮助客户负责任地使用大模型技术

微软有权在发现客户滥用API行为出现的时候停止他们的访问。

字节跳动最新声明

北京时间12月17日,字节跳动官方发布了一份详细声明解释关于使用OpenAI AI服务的相关情况:

公司在使用OpenAI相关服务时,强调要所有参与者遵守其使用条款,也正与OpenAI方面联系沟通,以澄清外部报道可能引发的误解。

✅今年年初,当技术团队刚开始进行大模型的初期探索时,有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。在4月公司引入GPT API调用规范检查后,这种做法已经停止。

✅早在今年4月,字节大模型团队已经提出了明确的内部要求,不得将GPT模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用GPT时遵守服务条款。

✅今年9月,公司内部又进行了一轮检查,采取措施进一步保证对GPT的API 调用符合规范要求。例如分批次抽样检测模型输出结果与GPT的相似度,避免数据标注人员私自使用GPT。

✅未来几天里,我们会再次全面检查,以确保严格遵守相关服务的使用条款。

截止EVA发稿前,OpenAI与微软方面暂时没有恢复字节跳动的账号访问权限。

【本文来自丨AI奇点网丨全网账号同名丨欢迎搜索关注】

AI奇点网丨提供1000+款AI效率工具丨AIEVA.CN丨欢迎访问