作者 | 李冬梅、核子可乐
最近,生成式 AI 创业公司 Midjourney 经历了 24 小时宕机,服务器因长时间宕机导致生成的图像无法在用户图库内正确显示。该公司认为这是由于“付费帐户的类似僵尸网络的活动”造成的。
此类攻击是各种在线中断的常见罪魁祸首,例如网站瘫痪或基于服务器的服务中断。DDoS 攻击一旦定罪,攻击者将面临 10 年监禁的风险,即使密谋实施这次袭击也可能导致一个人面临 5 年的入狱风险。
据 AI 行业专家兼 Midjourney 布道者 Nick St. Pierre 称,Stability AI 员工是 Midjourney 中断的幕后黑手。Midjourney 还认为,这次入侵是为了从 Midjourney 中获取提示和图像对数据。
作为回应,Midjourney 已明确表示将禁止 Stability AI 员工继续使用其服务,并指责同为生成式 AI 厂商的竞争对手,称本月早些时候曾有员工试图窃取 Midjourney 数据并造成系统宕机。
在 3 月 6 日的业务更新电话会议中,Midjourney 宣称“发现来自付费账户的类似僵尸网络的活动”,而且特别强调问题与 Stability AI 的员工有关,并最终引发此次服务中断。
3 月 6 日电话会议上的纪录内容,随后被发布至 Midjourney 的官方 Discord 频道。
根据 Nick St. Pierre 在 X 上的帖子,该公司称服务中断的原因是“Stability AI 的员工试图在上周六夜间提取全部提示词与图像对。”St. Pierre 还提到,Midjourney 已经发现有多个付费账户与 Stability AI 数据团队的一名成员有关。
有趣的是,Midjourney CEO David Holz 和 Stability AI CEO Emad Mostaque 都出现在了 St. Pierre 推文的评论中。
在 3 月 6 日的业务更新电话会议上(Midjourney 称之为「office hours」),Midjourney 表示为了应对中断,将“无限期”禁止一切 Stability AI 员工使用其服务。Midjourney 还出台一项新政策,称将封禁任何实施“激进自动化”或者导致服务中断的企业员工。
如果我们的团队成员真有此类行为(已进行过询问,后续将继续追查,也欢迎 Midjourney 直接与我们联系),真的非常抱歉,但这明显并不属于 DDoS 攻击,而仅仅是无心之失。此事肯定也非我们 Stability AI 所授意,但我们对数据抓取的结果感到满意。
St. Pierre 在 X 上向 Stability AI 公司 CEO Emad Mostaque 提出以上指控,Mostaque 则回帖称自己正在调查这一情况,且相关行为并非 Stability 授意为之。“让人不解的是,我们的 SD3 性能优于所有其他模型,我们的团队也一直在使用合成数据等训练素材,所以团队真的没有理由这么做。”他指的自然是目前尚处于预览阶段的 Stable Diffusion 3 AI 模型。他声称如果确认中断是由 Stability 员工造成,那也仅仅是无心之失,“明显并不属于 DDoS 攻击”。
Midjourney 公司创始人 David Holz 在同一条帖子中回复了 Mostaque,表示已向他发送了“一些信息”以协助开展内部调查。
除此之外,事态也仍在继续发展。自 3 月 6 日的会议以来,Midjourney 方面再未公布任何更新。截至本文撰稿时,Midjourney 与 Stability AI 也均未回应外媒 Verge 的置评请求。
此次员工盗窃数据风波将两家生成式 AI 初创企业推向了舆论漩涡中心。有用户表示质疑 Midjourney 公司的基础设施太过薄弱,不堪一击,而不是所谓的 Stability AI 员工的故意攻击。毕竟,小小两个账户的抓取活动就导致这次长时间的服务器中断,着实令人难以置信。
言外之意,Midjourney 的服务器烂透了却还甩锅给竞争对手。
有用户在 Reddit 上评论了此次 Midjourney 的宕机:“如果采取了适当的故障保护措施来限制单个 IP 地址可以建立的连接数量,那么一两个帐户将永远无法像 DDOS 攻击那样发挥作用。这意味着 Midjourney 的服务器崩溃可能是爬虫完全无意的副作用,而不是有意或他们预料到的结果。”
而此番风波也被其他创意生成用户所关注,他们普遍批评这两家公司(包括其他生成式 AI 系统)会在未经对象同意的情况下,从作品库中大量抓取在线数据来训练自家模型。Stable Diffusion 和 Midjourney 都曾面临多起版权诉讼,后者还被指控于去年 12 月创建了一套专供训练使用的艺术家数据库。
有用户认为,像 Midjourney 这样的公司使用未经许可从互联网上抓取的训练数据构建人工智能图像合成模型,却对自己的材料被抓取很敏感,是件很讽刺的事。
不仅很讽刺,他们的做法可能也是非法的。
有用户表示,像 Midjourney、OpenAI 等这类大模型公司,他们从公开渠道抓取私有材料并获益的行为是违法的。并建议法院应该强迫这些公司允许其他公司使用他们公开抓取的数据。
“就像电信公司和互联网提供商必须出租线路以进行竞争一样。这是一个公平合理的解决方案。我们没有授权这些公司抓取我们的数据。他们没有为他们抓取的数据付费。不应该允许他们只为自己存储我们的数据。每个人都应该从盗窃中受益,而不仅仅是他们自己。”
当被问及最近 Midjourney 与 Stability AI 的关系时,Mostaque 淡化了这种竞争。“没有真正的重叠,不过我们相处得很好,”他在接受外媒才采访时表示,两家公司的合作进入了历史上的一个关键环节。“我为 Midjourney 提供了资金支持,让他们开始起步,并提供现金补助来支付英伟达 A100 的测试费用。”
原文链接:
Stability AI员工偷了Midjourney的数据还搞崩人家服务器?网友:服务器烂透了还有脸甩锅给竞争对手_生成式 AI_李冬梅_InfoQ精选文章