ChatGPT声音遭“克隆”，“黑寡妇”斯嘉丽·约翰逊愤怒发声，OpenAI迅速回应

发表时间: 2024-05-21 14:47

每经记者：文巧每经编辑：兰素英

当地时间5月20日，外媒NPR独家公布了被影迷称为“寡姐”、科幻电影《她》中AI助手饰演者斯嘉丽·约翰逊发布的一篇声明，斯嘉丽指控OpenAI的ChatGPT非法使用其声音，同时要求将语音下架。

上周，OpenAI发布了最新旗舰模型GPT-4o，引爆科技圈。在发布会上，OpenAI展示了ChatGPT最新语音功能，不少人发现，其富有表现力的合成声音Sky与《她》中斯嘉丽饰演的AI助手的声音惊人地相似，这引发了激烈的讨论。

斯嘉丽声明称，2023年9月，ChatGPT推出语音模式时，OpenAI曾找过她希望为其配音，但由于个人原因拒绝。就在GPT-4o演示前两天，OpenAI还曾试图说服斯嘉丽，但在联系上之前，新模型就已发布。基于此，斯嘉丽的法律团队此前已向OpenAI发送两封声明，要求该公司详细说明其开发这种声音的过程。

由于斯嘉丽的指控，OpenAI在当地时间5月19日发表声明宣布暂停使用这款AI声音模板。同时，作为回应，该公司也公布了ChatGPT中5个配音的详细创作流程，称这是从400多名专业配音和演员中挑选出来的。

实际上，这已经不是OpenAI初次面临类似的指控。更早之前，《纽约时报》和《权力的游戏》原著作者乔治·马丁等在内的内容创作者都曾因版权问题将该公司告上法庭。而随着这场斗争延伸至语音领域，外媒Wired认为，这可能会带来新的有关深度伪造的威胁。

“寡姐”斯嘉丽：ChatGPT“偷”走我的声音

“当我听到发布演示时，我感到震惊、愤怒，并且不敢相信阿尔特曼会追求一种听起来与我如此相似的声音，以至于我最亲密的朋友和新闻媒体都无法分辨。”斯嘉丽在声明中这样写道。

图片来源：NPR记者Bobby Allyn的X账号

实际上，自去年9月OpenAI推出ChatGPT的语音模式以来，Sky的声音就一直可用。ChatGPT的语音模式一共有Breeze、Cove、Ember、Juniper和Sky五种声音。但直到上周OpenAI演示了最新的旗舰AI模型GPT-4o模型，使声音更具表现力时，Sky的声音与斯嘉丽的联系才变得清晰起来。

在上周的发布会上，OpenAI展示了ChatGPT最新语音功能，得益于反应速度的大幅提升，该功能几乎等同“实时对话”。随后，OpenAI首席执行官阿尔特曼在X平台上发布了“her”这个词，暗示科幻电影《她》已走入现实。不少人意识到，ChatGPT中富有表现力的合成声音与《她》斯嘉丽·约翰逊饰演的AI助手的声音惊人地相似，由此引发了外界激烈的讨论。

图片来源：X平台

而斯嘉丽的声明也指出，阿尔特曼用“她”来指代这部电影，似乎在鼓励全世界将ChatGPT最新演示与其表演联系起来。

她在声明中表示，2023年9月，ChatGPT推出语音模式时，阿尔特曼找到她，询问她是否愿意为ChatGPT配音，去安慰用户，弥合AI与人类之间巨大的差异所带来的不适感。斯嘉丽表示，经过深思熟虑后，她拒绝了这一提议。就在GPT-4o演示前两天，OpenAI还曾试图说服斯嘉丽，但在联系上之前，新模型就已发布。基于此，斯嘉丽的法律团队此前已向OpenAI发送两封声明，要求该公司详细说明其开发这种声音的过程。

OpenAI回应：暂停Sky语音，ChatGPT的5种声音来自400多份投稿

当地时间5月19日，OpenAI表示公司正采取措施解决问题，同时正在暂停使用这款AI声音模板。

该公司还公布了ChatGPT中5个配音的详细创作流程，称每一种声音都经过了长达五个月的精心挑选，且是从合作的配音演员中进行采样的，且每位演员的报酬都高于市场最高水平。

图片来源：OpenAI官网

OpenAI在声明中写道：“我们认为AI的声音不应该刻意模仿名人的独特声音——Sky的声音不是对斯嘉丽·约翰逊的模仿，而是属于另一位专业女演员，使用她自己自然的说话声音。为了保护他们的隐私，我们不能分享我们配音演员的名字。”

据悉，2023年5月，OpenAI的选角机构和选角导演发出了人才招募。不到一周，他们就收到了400多份配音演员和银幕演员的投稿。将近5个月后，他们挑选出了5种声音发布到ChatGPT中。

该公司为ChatGPT的声音制定了一套标准，仔细考虑了每个声音的独特个性及其对全球观众的吸引力。这些标准包括：有不同背景或能说多种语言的演员；一种听起来有“永恒”（timeless）感觉的声音；一种平易近人、能激发信任的声音；一种音色丰富，且温暖、引人入胜、充满自信、魅力十足的声音；自然且易于听取。

图片来源：OpenAI官网

深度伪造威胁或升级

《每日经济新闻》记者注意到，斯嘉丽的指控已经不是OpenAI初次面临类似的斗争。

今年5月初，包括《纽约每日新闻》和《芝加哥论坛报》在内的多家报纸在纽约联邦法院起诉OpenAI和微软，指控他们滥用新闻内容来训练生成式AI系统。

去年12月，《纽约时报》在纽约南区法院向OpenAI及其投资人微软公司提起侵犯版权诉讼；同月，多名普利策奖得主也起诉OpenAI和微软滥用自己作品训练大模型，指出这样的行为无疑是在“刮取”作家们的作品和其他受版权保护的材料。

更早之前，去年9月，美国作家协会以及包括《权力的游戏》原著作者乔治·马丁在内的17位美国著名作家对OpenAI发起集体诉讼，称OpenAI在未经授权的情况下使用原告作家的版权作品训练其AI模型。

OpenAI面临的难题也揭示了整个生成式AI领域与内容创作者之间权益边界的普遍性问题。

据媒体引用不完全统计数据称，自2022年11月至2023年10月，仅美国加州北区法院便已经受理了10起版权人起诉StabilityAI、OpenAI、Meta、Alphabet等公司未经授权，利用版权作品进行模型训练的案件。

外媒Wired评论称，与斯嘉丽的冲突将加剧OpenAI与艺术家、作家和其他创意人士之间的现有斗争。随着这场争斗蔓延至语音领域，Wired认为，生成式AI使创建逼真的合成声音变得更加容易，这可能会带来新的有关深度伪造的威胁。

实际上，OpenAI今年3月就曾表示，它已经开发出一种可以从15秒的剪辑中克隆某人声音的技术，但该公司表示不会发布该技术，因为它可能会被滥用。

每日经济新闻

ChatGPT声音遭“克隆”，“黑寡妇”斯嘉丽·约翰逊愤怒发声，OpenAI迅速回应

“寡姐”斯嘉丽：ChatGPT“偷”走我的声音

OpenAI回应：暂停Sky语音，ChatGPT的5种声音来自400多份投稿

深度伪造威胁或升级

热门阅读

推荐阅读