十天后,我洞察到Sora背后的OpenAI的宏大愿景

发表时间: 2024-02-28 16:22

什么?我又要失业了。

龙年的第一把火来了,open i发布了首个视频生成模型,sora大流量简直了,搜索指数是嘎嘎涨。从功能介绍到技术原理,连背后团队都给你扒光了,春节放假都挡不住它刷屏的速度。

ai视频模型过去不是没有,但sorry为何能让整个ai界抖三抖?别着急,给柯仔点赞收藏一波,精彩马上来。

要说sorry怎么牛?这么说吧,别的ai还在玩绣花针,sorry已经耍上炮了。短短几行字,sorry就能生成一段清晰逼真的2k视频,人物背景毫无违和感,并且时长能达到六十秒。要知道在ai视频领域,领头的软位卡等老大哥都还卡在五秒之内。

不仅如此,骚扰还能实现不同视频片段的拼接,上演丝滑过渡。不管是向前、向后扩充视频,还是更换视频内容背景,都能保持视频风格的一致性和连贯性,直接服务一条龙。但这些只能算开胃菜,sorry最让人惊艳的是它已经能还原现实世界中的部分物理法则了。

什么意思?来举个例子,一拳垂向玻璃茶几和一拳垂向纯棉床被,结果有什么不同?茶几可能会碎,而床被只会凹陷在回弹。在我们看来这不就是常识吗?但这要让ai来区分可就太难了。

而在骚扰的视频里,它能清晰的模拟咖啡产生的水波纹,液体带动着海盗船上上下下起伏,甚至连咖啡沫这种细节都很真实,拿去跟友商对比完全是碾压级别。ai都能产大片做特效了,那视频工作者只能提前庆祝自己失业了吗?

但朋友们先别慌,让我们重新仔细的盘一盘细看sorry的技术报告。柯仔发现open ai的野心可不只是视频,open i一开始对骚扰的定义就是作为世界模拟器的视频生成模型,目光还得放远了看。

拿红衣教主的话来说,sorry的应用不止影视,还有更多。比如sorry有可能会带来真正的自动驾驶。你想想看,当ai在驾驶汽车跟人一样,要判断对方速度怎么样,有无障碍物,能否安全加塞,需要执行什么操作。这种判断就是基于认知层面的东西。

但对于现在的自动驾驶技术来说还有点难度,所以当sorry开始理解世界,模拟真实的世界,那真正的自动驾驶也不远了。不止如此,各行各业都会迎来突破和革新。对此知名网友马斯克表示,sorry刚发布就有网友评论,季季皮克斯马斯克也回应是人类祭祭啦。

玩笑归玩笑,其实从opnai对人才钱财的投入以及本身超强的实力也能看出,这次骚可能只是小试牛刀,杀手锏还没出。据江湖传说,恰吉bt训练数据高达一点七六万一个,数据标记都得派博士上场。加上奥特曼之前狂买芯片,还准备筹集七万亿美金,要给全球ai芯片来个大变身。

七万亿,好小众的词,这什么水平已经相当于全球gdp的百分之十,直接打包带走微软、苹果两家顶级科技公司,还可以外加一个可爱的柯仔嘻嘻钱堆钱。为的就是大量更大量的算力,画质越清晰需要的算力也就越高。很明显open i最终想做的可不是简单的纹身饰品,它的野心在世界。

当然目前公布的sorry好像还撑不起open i的野心,在这方面open i也很实诚,直接在官网放出了翻车视频,比如倒着跑步的人、无限分身的狗、凭空出现了椅子等等。好家伙,这谁看了不说一句牛逼。

说到这屏幕前的你发现开头画面的bug了吗?仔细看这里,好姐姐,你给这摇花手呢?除了人物的动作里头还有一个bug,欢迎眼见的你来留言讨论。

骚扰目前还有很多局限,所以关于世界模拟器的叫法也有很多争论,认为这是在神话骚扰,但不管是赞美还是神话背后都是一个公式。open i是有点东西的,三个月前open i发布gpt store,一众ai创业项目含泪而亡。三个月后sora登场,ai生成视频领域又要面临重新洗牌。

open ai的每次动作都跟开了金手指似的,一甩就是横扫几条街,对普通人来说是好事,工具越来越强了,但对市场来说可不见得,毕竟科技市场总是赢者通吃,open ai无疑是悬在其竞品头上的一把刀。对于还在为自家大模型评分而沾沾自喜自己的厂商或者是将希望寄托于tok业务的创业型公司,一不小心可能就真忌忌了。

本期视频就到这,记得给柯仔点赞、收藏加关注,下期将带来更多精彩的科技穿大褂,么么哒。