Open AI震撼发布：Sora视频生成模型，文字输入即刻转化为视频

发表时间: 2024-02-16 19:05

OpenAI将把人工智能技术带到视频领域。该公司周四推出了新的生成式人工智能模型Sora。Sora的工作原理类似于OpenAI的图像生成人工智能工具DALL-E。用户输入想要的场景，Sora就会返回一个高清视频剪辑。Sora还可以生成受静态图像启发的视频剪辑，并扩展现有视频或填充缺失的帧。

随着聊天机器人和图像生成器进入消费者和商业世界，视频可能成为生成式人工智能的下一个前沿领域。虽然创造性的机会将激发人工智能爱好者，但随着全球重大政治选举的临近，新技术带来了严重的错误信息担忧。

OpenAI希望通过Sora与Meta(META.US)和谷歌等公司的视频生成人工智能工具竞争。谷歌今年1月宣布推出AI视频大模型Lumiere。其他初创公司也有类似的人工智能工具，比如Stability AI，该公司有一款名为Stable Video Diffusion的产品。亚马逊还发布了“Create with Alexa”，这是一个专门生成基于提示的儿童动画短片的模型。

Sora目前仅限于生成一分钟或更短的视频。在提供更广泛的人工智能模型套件的努力中，由微软支持的OpenAI将多模态(结合文本、图像和视频生成)作为目标。

到目前为止，Sora仅供一小部分安全测试人员或“红队”使用，他们测试该模型在错误信息和偏见等方面的漏洞。除了在其网站上可以找到的10个样本片段外，该公司还没有发布任何公开演示，并表示将在周四晚些时候发布随附的技术论文。

OpenAI还表示，它正在构建一个“检测分类器”，可以识别Sora生成的视频片段，并计划在其输出中包含某些元数据，以帮助识别AI生成的内容。这是Meta在今年大选年用来识别人工智能生成的图像的同一类型的元数据。

Sora是一种扩散人工智能模型，与ChatGPT一样，它使用了谷歌研究人员在2017年的一篇论文中介绍的Transformer架构。OpenAI在声明中写道:“Sora是能够理解和模拟现实世界的模型的基础。”

本文源自智通财经

Open AI震撼发布：Sora视频生成模型，文字输入即刻转化为视频

热门阅读

推荐阅读