OpenAI将把人工智能技术带到视频领域。该公司周四推出了新的生成式人工智能模型Sora。Sora的工作原理类似于OpenAI的图像生成人工智能工具DALL-E。用户输入想要的场景,Sora就会返回一个高清视频剪辑。Sora还可以生成受静态图像启发的视频剪辑,并扩展现有视频或填充缺失的帧。
随着聊天机器人和图像生成器进入消费者和商业世界,视频可能成为生成式人工智能的下一个前沿领域。虽然创造性的机会将激发人工智能爱好者,但随着全球重大政治选举的临近,新技术带来了严重的错误信息担忧。
OpenAI希望通过Sora与Meta(META.US)和谷歌等公司的视频生成人工智能工具竞争。谷歌今年1月宣布推出AI视频大模型Lumiere。其他初创公司也有类似的人工智能工具,比如Stability AI,该公司有一款名为Stable Video Diffusion的产品。亚马逊还发布了“Create with Alexa”,这是一个专门生成基于提示的儿童动画短片的模型。
Sora目前仅限于生成一分钟或更短的视频。在提供更广泛的人工智能模型套件的努力中,由微软支持的OpenAI将多模态(结合文本、图像和视频生成)作为目标。
到目前为止,Sora仅供一小部分安全测试人员或“红队”使用,他们测试该模型在错误信息和偏见等方面的漏洞。除了在其网站上可以找到的10个样本片段外,该公司还没有发布任何公开演示,并表示将在周四晚些时候发布随附的技术论文。
OpenAI还表示,它正在构建一个“检测分类器”,可以识别Sora生成的视频片段,并计划在其输出中包含某些元数据,以帮助识别AI生成的内容。这是Meta在今年大选年用来识别人工智能生成的图像的同一类型的元数据。
Sora是一种扩散人工智能模型,与ChatGPT一样,它使用了谷歌研究人员在2017年的一篇论文中介绍的Transformer架构。OpenAI在声明中写道:“Sora是能够理解和模拟现实世界的模型的基础。”
本文源自智通财经