深入了解长江证券的AI视频生成技术新突破

发表时间: 2024-07-02 15:02

智通财经APP获悉,长江证券发布研报称,快手“可灵”在推出文生视频功能后,正式推出图生视频功能和视频续写功能,进一步拓宽视频创作边界。OpenAI 加强区域限制背景下,已有阿里云、腾讯云等多家厂商为开发者提供替代方案或搬迁优惠,但技术上与 OpenAI 仍有差距。限制或将成为催化国内 AI 技术发展的契机,激励国内大模型厂商不断迭代创新,加速国内的大模型厂商与各行业深度合作,进而推动 AI 技术的应用落地,构建更加开放和创新的 AI 生态。

事件描述:

快手“可灵”在推出文生视频功能后,6 月 21 日再次进化,正式推出图生视频功能和视频续写功能,视频最长可延伸至 3 分钟。OpenAI 近期在官方邮件中表示,自 7 月 9 日起,OpenAI 将开始阻止来自非支持国家和地区的 API 流量。

事件评论:

可灵升级进一步拓宽视频创作边界。1)图生视频功能化静为动,可按需定制视觉叙事。可灵允许用户将任意静态图像转化为 5 秒的动态视频,图生视频模型融入了强大的提示词融合技术,深化对图像语义与用户指令的理解整合。用户根据自己的创意输入文本指令,模型便能根据文本内容实现丰富的视觉叙事。图生视频功能不仅继承了此前文生视频方面的卓越特性,如创造逼真运动场景、精确模拟物理特性,以及输出电影级画质等,还通过 3D 时空联合注意力机制,展现了在构建复杂时空运动方面的卓越能力。2)视频续写功能延续内容,满足多元创作需求。可灵大模型支持对已经生成的视频进行一键续写,单次让视频运动延续 4.5 秒,运动内容合理、幅度显著;并且通过连续多次续写,最长可生成 3 分钟的视频。视频续写不仅保持了新生成部分与原视频间的运动连贯性和物理合理性,还能够巧妙融入大幅度的动作变化,提升视频的生动性。6 月海内外视频生成领域迎来一轮产品爆发,除快手外,Luma AI 的 Dream Machine 以及 Runway 迭代更新后的Gen-3 Alpha 等高质量产品相继涌现。而可灵的一部分优势在于快手拥有庞大的用户基础和丰富的视频内容,或能够为可灵的训练提供海量且多样的数据资源。

OpenAI 加强区域限制或将倒逼国内厂商技术迭代。1)OpenAI 的 API 区域限制对国内影响或有限。OpenAI 此前并未向中国市场提供服务,亦未向中国用户开放注册和使用。且目前微软的 Azure 云服务是国内访问 OpenAI API 的正规渠道,但微软并未发布类似的限制通知。2)多家国产大模型厂商采取迁移计划,加速抢占市场。智谱首先推出了 OpenAI API 用户特别搬家计划,帮助用户切换至国产大模型,包括为开发者提供 1.5 亿 Token 以及从 OpenAI 到 GLM 的系列迁移培训;对于高用量客户,则提供与 OpenAI 使用规模对等的 Token 赠送计划等。此外,目前已有百度智能云、阿里云、腾讯云、科大讯飞、商汤科技、百川智能、MiniMax、零一万物等多家厂商为开发者提供替代方案或搬迁优惠,以吸引更多开发者使用国产大模型;月之暗面则是从一开始就兼容 OpenAI 的 API,开发者可以平滑迁移。此前国内多家大模型厂商通过降价或免费策略吸引更多使用者,但技术上与 OpenAI 仍有差距。而此次 OpenAI 的限制或将成为催化国内 AI 技术发展的契机,激励国内大模型厂商不断迭代创新,淘汰 OpenAI 套壳产品;并加速国内的大模型厂商与各行业深度合作,进而推动 AI 技术的应用落地,构建更加开放和创新的 AI 生态。

国内 AI 技术及应用加速迭代。OpenAI 的区域限制有望加速国内 AI 技术推进,而国内高质量模型频出显示出国内厂商正加速追赶, AI 技术及应用领域持续突破,建议持续关注 AI 在广告、电商、影视、游戏和教育等各领域的商业化落地。

风险提示

1、AI 技术发展不及预期风险。AIGC 新技术仍处于探索和发展期,技术和数据迭代速度存在不及预期风险,因此大厂大模型存在推出时间不及预期、推出运用效果不及预期风险。

2、内容监管风险。AI 技术生成的部分内容可能涉及敏感内容,由于尚未出台规范 AIGC的法规和政策,所以存在 AI 生成内容面临监管风险。