AIGC迈入规模化应用期,揭秘视频生成红利背后的力量

发表时间: 2024-10-15 11:36

文|刘永东

2024年,科技界迎来历史性时刻,在国外,OpenAI正式推出了视频生成大模型Sora; 在国内,快手率先推出了自研的视频生成大模型“可灵”。这一创新标志着AI技术从文本生成迈向视频生成的新阶段,也将“视频生成”从实验室概念转变为能够模拟现实世界的强大工具,预示着AIGC(人工智能生成内容)领域将加速迎来红利期。

技术进步:从尝试到飞跃

在数字化浪潮的推动下,信息的传递与接收渠道变得前所未有的多样化。视频凭借其独特的多维信息展现能力、丰富的画面表现以及生动的动态特性,已跃升为信息传播领域的核心力量。与单纯的文字描述和静态图像相比,视频能够无缝集成文本叙述、直观图像、生动声音及精细的视觉效果,于一帧帧画面中交织出多层次的信息网络,为观众带来深度体验与沉浸享受。这种融合多种感官刺激的表达方式,极大地增强了信息传递的效果与感染力。

我国庞大的互联网用户群体和丰富的短视频内容资源,为视频生成大模型的训练和发展提供了海量且高质量的基础数据支持,具备发展视频生成大模型的天然优势,已经涌现出如快手“可灵”、商汤“Vimi”、智谱“清影”、爱诗科技“Pixverse”等诸多产品。作为短视频直播平台,快手“可灵”具有独特优势,不仅在生成速度、视频时长、连贯性、美观性、逼真性等硬指标上表现不俗,更对复杂指令能够精准理解和创造性执行,使得AI生成的视频内容贴近人类创作水平。

赋能应用:从想象到现实

Sora和“可灵”等大模型产品的发布不仅彰显了AI在视频生成领域的巨大潜力,还极大地激发了人们对于其广泛应用场景的想象。在教育领域,视频生成技术让虚拟实验、历史场景再现成为可能,极大地丰富了教育资源的多样性和个性化;在游戏开发方面,AI生成的游戏场景、角色和剧情降低了开发门槛,提升了游戏可玩性和多样性;在医疗领域,视频生成技术辅助模拟手术、展示病灶,为医生提供直观的诊断依据;在文娱产业,AI不仅辅助编剧,还能自动生成场景、角色、特效,显著缩短制作周期、降低成本。目前,李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯9位导演正在依托“可灵”大模型制作完全由AIGC生成的电影短片,大模型将展现“电影级”能力。

行业落地:从概念到实践

在短短半年间,视频生成大模型迅速完成了从技术创新到探索落地,再到广泛商业应用的转变。如在电商领域,视频大模型已经实现了实质性的“赋能”,实实在在的“提质增效”。商家可以利用AI快速生成产品展示视频,以更直观、生动的方式向消费者展示商品的特点和优势。这不仅提升了购物体验,还促进了商品的销售转化。以快手为例,基于“快意”大模型构建的视频脚本生成、直播实时脚本生成、广告线索客服等功能,结合数字人技术,帮助广告主低成本生成高品质内容,提升了线索转化效率,使得快手AIGC月活跃客户数从年初至今增长了8倍,月GMV规模提升了64倍,平台AIGC广告收入规模提升了12倍,AIGC营销素材在6月单日消耗峰值突破2000万。截至目前,“可灵”AI已经累计服务超过260万用户,生成5300万张图片、2700万个视频,显示了大模型在商业场景中的巨大潜力。

未来展望:机遇与挑战并存

我国高度重视生成式人工智能的发展,《中共中央关于进一步全面深化改革、推进中国式现代化的决定》明确提出要“完善生成式人工智能发展和管理机制”。各级政府也在积极推进相关政策的落地实施,围绕生成式人工智能的算法、算力、数据、场景、人才等方面不断部署,多渠道、多手段支持生成式人工智能的发展。

与此同时,视频生成大模型的广泛应用,也带来了一系列挑战和问题,如创作范式的变革。“文生视频”“图生视频”的创作方式完全不同于原有的电影视频创作,需要尽快研究相关教程,帮助大模型更好地赋能创作。此外,由于生成内容的逼真性不断提升和门槛不断降低,如何确保生成内容蕴含的真实性、避免虚假信息的传播,如何保护知识产权,这些问题都需要我们共同面对和解决。近日,国家互联网信息办公室已经发布《人工智能生成合成内容标识办法(征求意见稿)》相关规定。在政策的引导下,视频生成行业将会更加规范、健康地发展,为社会进步和繁荣贡献更大的力量。

大模型迈入规模化应用期,视频生成红利加速显现,这不仅是AI技术的又一次飞跃,更为我们开启了一个充满无限可能的新世界。相信在各方共同努力下,以视频生成为主导的AIGC将加速落地,赋能各行各业,推动社会向更加美好的未来迈进。

(本文作者所属单位:国家工业信息安全发展研究中心)