重磅!Stable Diffusion 3即将在下周开源,你准备好了吗?

发表时间: 2024-06-03 21:16

在台湾举办的台北国际电脑展上,Stability AI CTO 兼联合 CEO Christian Laforte 与 AMD CEO 苏姿丰一起宣布文本到图像生成模型 Stable Diffusion 3 将于 6 月 12 日开源

看 Stability AI 在 X 上发布的消息,此次开源的是 Stable Diffusion 3 Medium,这是一款拥有 20 亿参数的模型。

Laforte 在活动中提到:“我们为此投入了很多心血”,特别是在 AI 安全方面,因此 Stability AI 认为经过修订的模型已经准备好进行更广泛的测试。

Laforte 认为这次发布标志着 AI 模型开发方式的变革

“以前是研究前沿引领这些模型的发展,” 他表示。“现在这似乎是一个自然的进化。通过开源模型,我们让人们能够解锁新的使用场景。

Laforte 没有提供 Stable Diffusion 3(SD3)的技术细节,但他用一张放在在华丽的木吉他弦上的人手的黑白图像来展示这一版本的改进 —— 一张是用 2023 年推出的 SD XL 1.0 创建的,另一张是用 SD3 创建的。

“任何涉及手和重复图案的东西都非常难,” 他解释道,称赞用 SD3 创建的图像在 “吉他的形状和手的细节” 方面更加真实。

Laforte 评价说,这些图像 “在某些地方有一些瑕疵”,但 “一个很大的变化” 是由一个多模态扩散 Transformer 实现的,它可以更好地理解提示。

Laforte 还展示了一些由 SD3 在输入提示所需时间更短的时间内生成的图像。

他将模型的改进归功于硬件提供的更多高带宽内存。“92 GB 的 HBM 是游戏规则的改变者,” 他兴奋地说,然后表达了对更强大硬件的渴望。

“我们需要更多的内存和计算能力,” 他宣称 —— 这一观点得到了 AMD 的苏姿丰的回应,“我认为你需要一些 GPU。” 苏姿丰特别赞同 Laforte 关于 SD3 将在她在同一主题演讲中宣布的 Ryzen 300 AI CPU 上运行良好的消息。

Stability AI 为潜在用户创建了一个 “权重列表”。有趣的是,报名表包括一个 Discord ID 字段 —— 这反映了 SD 在游戏开发者中的受欢迎程度。

候补注册地址:https://stability.ai/stablediffusion3