每经记者:文巧 每经编辑:兰素英
当地时间5月20日,外媒NPR独家公布了被影迷称为“寡姐”、科幻电影《她》中AI助手饰演者斯嘉丽·约翰逊发布的一篇声明,斯嘉丽指控OpenAI的ChatGPT非法使用其声音,同时要求将语音下架。
上周,OpenAI发布了最新旗舰模型GPT-4o,引爆科技圈。在发布会上,OpenAI展示了ChatGPT最新语音功能,不少人发现,其富有表现力的合成声音Sky与《她》中斯嘉丽饰演的AI助手的声音惊人地相似,这引发了激烈的讨论。
斯嘉丽声明称,2023年9月,ChatGPT推出语音模式时,OpenAI曾找过她希望为其配音,但由于个人原因拒绝。就在GPT-4o演示前两天,OpenAI还曾试图说服斯嘉丽,但在联系上之前,新模型就已发布。基于此,斯嘉丽的法律团队此前已向OpenAI发送两封声明,要求该公司详细说明其开发这种声音的过程。
由于斯嘉丽的指控,OpenAI在当地时间5月19日发表声明宣布暂停使用这款AI声音模板。同时,作为回应,该公司也公布了ChatGPT中5个配音的详细创作流程,称这是从400多名专业配音和演员中挑选出来的。
实际上,这已经不是OpenAI初次面临类似的指控。更早之前,《纽约时报》和《权力的游戏》原著作者乔治·马丁等在内的内容创作者都曾因版权问题将该公司告上法庭。而随着这场斗争延伸至语音领域,外媒Wired认为,这可能会带来新的有关深度伪造的威胁。
“当我听到发布演示时,我感到震惊、愤怒,并且不敢相信阿尔特曼会追求一种听起来与我如此相似的声音,以至于我最亲密的朋友和新闻媒体都无法分辨。”斯嘉丽在声明中这样写道。
图片来源:NPR记者Bobby Allyn的X账号
实际上,自去年9月OpenAI推出ChatGPT的语音模式以来,Sky的声音就一直可用。ChatGPT的语音模式一共有Breeze、Cove、Ember、Juniper和Sky五种声音。但直到上周OpenAI演示了最新的旗舰AI模型GPT-4o模型,使声音更具表现力时,Sky的声音与斯嘉丽的联系才变得清晰起来。
在上周的发布会上,OpenAI展示了ChatGPT最新语音功能,得益于反应速度的大幅提升,该功能几乎等同“实时对话”。随后,OpenAI首席执行官阿尔特曼在X平台上发布了“her”这个词,暗示科幻电影《她》已走入现实。不少人意识到,ChatGPT中富有表现力的合成声音与《她》斯嘉丽·约翰逊饰演的AI助手的声音惊人地相似,由此引发了外界激烈的讨论。
图片来源:X平台
而斯嘉丽的声明也指出,阿尔特曼用“她”来指代这部电影,似乎在鼓励全世界将ChatGPT最新演示与其表演联系起来。
她在声明中表示,2023年9月,ChatGPT推出语音模式时,阿尔特曼找到她,询问她是否愿意为ChatGPT配音,去安慰用户,弥合AI与人类之间巨大的差异所带来的不适感。斯嘉丽表示,经过深思熟虑后,她拒绝了这一提议。就在GPT-4o演示前两天,OpenAI还曾试图说服斯嘉丽,但在联系上之前,新模型就已发布。基于此,斯嘉丽的法律团队此前已向OpenAI发送两封声明,要求该公司详细说明其开发这种声音的过程。
当地时间5月19日,OpenAI表示公司正采取措施解决问题,同时正在暂停使用这款AI声音模板。
该公司还公布了ChatGPT中5个配音的详细创作流程,称每一种声音都经过了长达五个月的精心挑选,且是从合作的配音演员中进行采样的,且每位演员的报酬都高于市场最高水平。
图片来源:OpenAI官网
OpenAI在声明中写道:“我们认为AI的声音不应该刻意模仿名人的独特声音——Sky的声音不是对斯嘉丽·约翰逊的模仿,而是属于另一位专业女演员,使用她自己自然的说话声音。为了保护他们的隐私,我们不能分享我们配音演员的名字。”
据悉,2023年5月,OpenAI的选角机构和选角导演发出了人才招募。不到一周,他们就收到了400多份配音演员和银幕演员的投稿。将近5个月后,他们挑选出了5种声音发布到ChatGPT中。
该公司为ChatGPT的声音制定了一套标准,仔细考虑了每个声音的独特个性及其对全球观众的吸引力。这些标准包括:有不同背景或能说多种语言的演员;一种听起来有“永恒”(timeless)感觉的声音;一种平易近人、能激发信任的声音;一种音色丰富,且温暖、引人入胜、充满自信、魅力十足的声音;自然且易于听取。
图片来源:OpenAI官网
《每日经济新闻》记者注意到,斯嘉丽的指控已经不是OpenAI初次面临类似的斗争。
今年5月初,包括《纽约每日新闻》和《芝加哥论坛报》在内的多家报纸在纽约联邦法院起诉OpenAI和微软,指控他们滥用新闻内容来训练生成式AI系统。
去年12月,《纽约时报》在纽约南区法院向OpenAI及其投资人微软公司提起侵犯版权诉讼;同月,多名普利策奖得主也起诉OpenAI和微软滥用自己作品训练大模型,指出这样的行为无疑是在“刮取”作家们的作品和其他受版权保护的材料。
更早之前,去年9月,美国作家协会以及包括《权力的游戏》原著作者乔治·马丁在内的17位美国著名作家对OpenAI发起集体诉讼,称OpenAI在未经授权的情况下使用原告作家的版权作品训练其AI模型。
OpenAI面临的难题也揭示了整个生成式AI领域与内容创作者之间权益边界的普遍性问题。
据媒体引用不完全统计数据称,自2022年11月至2023年10月,仅美国加州北区法院便已经受理了10起版权人起诉StabilityAI、OpenAI、Meta、Alphabet等公司未经授权,利用版权作品进行模型训练的案件。
外媒Wired评论称,与斯嘉丽的冲突将加剧OpenAI与艺术家、作家和其他创意人士之间的现有斗争。随着这场争斗蔓延至语音领域,Wired认为,生成式AI使创建逼真的合成声音变得更加容易,这可能会带来新的有关深度伪造的威胁。
实际上,OpenAI今年3月就曾表示,它已经开发出一种可以从15秒的剪辑中克隆某人声音的技术,但该公司表示不会发布该技术,因为它可能会被滥用。
每日经济新闻