Open AI的Sora平台：王炸级别的文字生成视频技术！

发表时间: 2024-02-17 08:00

你能想到这是AI制作的视频吗？

今天最爆炸的新闻莫过于Open AI新推出的文字生成视频平台Sora，可支持文字生成60秒精准长视频。之前的人工智能生成的3秒视频都是这样的。

而Sora生成的视频效果则是

毫无疑问，Sora的发布将会是爆炸性的，人工智能在学习了几乎整个人类所储存的信息和知识后，终于开始以视觉化的形式真正参与创造这个世界了。

Sora为什么会成为震惊业界的新工具？

首先，Sora的视频质量已经让人难辨真假。如果不仔细寻找画面中的细小瑕疵，我们很难区分到底是拍摄的视频内容还是由AI生成的。

即使是暂停在某一帧上，画面效果也远超Open AI的文字绘图DALL-E 3和SD，果然，能超越Open AI 的就只有Open AI自己了。

第二，时间和空间的连贯性。这意味着人工智能已经可以准确理解视频中的每帧图像应该如何互相匹配。

这意味着AI正在逐渐理解空间概念并开始尝试制造和表达空间，并能够满足人们对于空间和时间的“合理性”要求了。

第三，对象的持久性和一致性。过去的人工智能生成图片或视频的很大一个难点就是保证对象的一致性。即使是同样的描述语每次生成的内容也会存在一定偏差。

而Sora似乎已经具有了连续思维能力，可以通过上一个画面的内容计算对应的变化量生成下一个画面，进而保持视频对象的一致性。

第四，创造性。当人工智能可以生成高质量的长视频的时候，我们的提示词将不再那么重要，因为大部分时候其实人类的提示词只是一个方向或设想，很难有人会想象太多细节。

而当人工智能生成的视频足够细腻，足够合理甚至有足够的合理性和创意的时候，AI就已经成为了内容创作的主角。

Sora的野心绝不仅止于视频生成，想象一下，如果将其技术搭载到苹果新上市的Vision Pro或者马斯克的脑机接口上，随着云端算力的逐渐充足，建立起基于实体空间的数字平行宇宙的面世将只是时间问题。

AI可以根据视角方向即时生成符合设计的虚拟场景，叠加现实世界互动，真人版马里奥游戏，赛博商业街将不再只是科幻小说。