近日,微软(MSFT.US)公布了VASA-1。官网介绍道:只需使用单张人物肖像照片+一段语音音频,即可实时生成高仿真的数字人讲话视频,唇部动作、面部动作和头部运动都与音频内容同步,其表现高度自然协调。
生成数字人视频
从微软的演示来看,不仅提供具有逼真的面部和头部动态的高质量视频,而且还支持高达40 FPS的在线生成512x512尺寸视频,并且启动延迟可以忽略不计。这项技术为与模仿人类对话行为的逼真数字人进行实时互动提供支持。
微软表示,这是一个新的框架,可以在给定单张静态图像和语音音频的情况下,生成具有吸引人的视觉情感技能(VAS)的逼真的虚拟数字人说话视频。
无独有偶,日前,乐华娱乐集团宣布以3000万人民币的价格收购字节跳动朝夕光年旗下的虚拟偶像团体A-SOUL和枝江娱乐艺人。其中与A-SOUL相关的技术、知识产权、设备和域名。
A-SOUL关联厂牌“枝江娱乐官方”在B站确认了相关消息。乐华收购A-SOUL一事更突出IP版权的重要性:“将更高效及有效地提升本公司开发虚拟艺人和进一步经营A-SOUL的综合能力,从而保持本公司在虚拟艺人领域及泛娱乐市场的领先地位。”
迎来持续高速发展
时至今日,随着人工智能、虚拟现实等技术的发展,虚拟人频繁出现在公众视野中。作为新生事物,虚拟人是AI技术落地的一大应用领域,多模态AI技术使得数字人交互能力不断推进,技术决策与语言输出都开始更接近真人。
虚拟人物的商业化逐步应用,主要在以下三个领域:虚拟偶像、虚拟主播、数字员工。相比于真人,虚拟偶像通过定期在视频网站、社交平台上投稿和在线互动;虚拟主播能够收获一定的流量;数字员工则高效快捷,实现业务流程自动化,大幅降低成本,提升政府和企业管理与运营效率。
据艾媒咨询发布的数据,预计2025年分别达到 6402.7 亿元和 480.6 亿元,呈现强劲的增长态势。由此不难看出,虚拟人物的商业化应用有着强劲的增长势头,未来虚拟偶像产业将迎来持续高速发展,行业发展前景和潜力无疑是巨大的。
微美全息助推新高度
据了解,微美全息(WIMI.US)作为业内虚拟人赛道的头部玩家,近年来持续研发数字人,获得外界持续关注。得益于顶级的AI技术、实时渲染、3D建模以及动作捕捉等技术的强势加持,让虚拟人能智能识别人脸、表情、手势、语音多模交互信息,在音乐、直播、演出等全领域探索多元化发展道路,在年轻Z世代群体中拥有强大的号召力。
在视觉呈现上,微美全息的虚拟人技术也支持4K 乃至8K 的超高清画质,提供沉浸式的视觉体验。用户无时无刻都能欣赏到细腻逼真的虚拟人形象,沉浸感将大大增强,更多高端应用场景成为可能,有望重构内容展现形式,在社交、短视频、乃至电商、教育等场景有望迎来成长与竞争格局重构的机遇。
与此同时,微美全息加快头部虚拟偶像IP深化变现,提高其商业化能力,已经累计5000件内容IP。长期来看,微美全息基于虚拟空间的数字人有望成为IP形象的重要组成形式,后续从IP打造、运营再到变现形式均有望持续升级,或将显著提升虚拟人IP内容方产业链地位以及商业变现广度。
结尾
事实上,随着娱乐需求的增加,AI等技术不断迭代的环境下,虚拟人产业高速发展,再加上元宇宙的热潮加速推动虚拟人产业升级。未来已来,虚拟人有广阔的适用空间。随着技术的不断进步,微美全息将继续在创新和责任之间寻找平衡,引领行业技术向前发展,引领虚拟人进一步走入大众的日常生活。