3月29日,由第十一届中国网络视听大会组委会主办,中国网络视听协会、中国传媒大学媒体融合与传播国家重点实验室和数字人研究院联合承办,元力趋势网协办的AIGC与数字人发展论坛在成都召开。本次分论坛以“AI想象力,视听新动力”为主题,探讨AIGC与数字人在网络视听领域的最新成果及前沿应用。
作为中国网络视听大会的重点分论坛,来自科大讯飞、腾讯云、360公司、百川智能等国内头部大模型相关负责人,阿里云、小冰公司、央博、英雄联盟、蓝色光标、新壹科技、黑镜科技、迈吉客科技、元圆科技等头部数字人、AIGC企业相关负责人,以及国家重点实验科学家、数字人研究院院长等重磅嘉宾出席分享。
中国网络视听协会副会长罗建辉指出,AI技术的发展为网络视听行业带来了前所未有的机遇,应当鼓励和支持行业内的技术创新、资金扶持和人才培养,应用新技术、生产新内容、提供新服务,推动AI技术在网络视听行业的深入研究和应用、提升整个行业的生产力。与此同时,用“AI”加强内容监管,培养行业从业者的“AI”素养也是行业的必修课。
作为论坛发起方,中国传媒大学副校长杨懿表示,AI将成为社会和各个领域的底层操作系统,人和人、人和社会的关系将发生颠覆性的变化。AIGC与数字人技术蓬勃发展,不仅改写了传统视听内容创作的范式,更是成为引领我国乃至全球文化产业升级换代的崭新动力。中国传媒大学将持续加大在AIGC与数字人技术上的研究投入,着力提升自主创新能力,通过校企协同育人,凝聚更多优质企业加入产教融合链条,为培养更多复合型创新人才提供持续动能。
大模型专家齐聚 探讨AIGC新质生产力
随着生成式AI的发展,AIGC在内容创造、用户体验、交互方式等方面带来革命性的变化。论坛上,星火大模型、混元大模型、百川大模型、360智脑等的负责人、算法专家齐聚一堂,分享了各自的洞察。
360集团创始人周鸿祎通过“数字分身”参与了大会。他认为,2024年将是大模型场景应用元年,大模型爆发后,网络视听行业一定是最先获得受益的行业。当下,AIGC、数字人等新技术已经活跃在行业各处,实实在在的赋能了行业发展。未来,大模型会让内容行业的供给变得更加丰富,这会极大拓展视听产品生产想象空间,给视听行业带来了“质量与效率”变革。
科大讯飞联合创始人、高级副总裁江涛在演讲中强调了大模型在解放生产力,释放想象力上的价值。他举例说,科大讯飞和中央广播电视总台、人民日报、新华社有很多视听内容方面的合作,这些合作显著的提高了内容生产、内容管理、内容安全的劳动生产率。值得关注的是,科大讯飞或于今年年底前发布讯飞版Sora,新的应用会大幅度降低创新成本,提高生产效率。
腾讯云副总裁、腾讯混元大模型负责人刘煜宏则聚焦于多模态内容的生成。据介绍,腾讯内部已有超过400个产品使用了腾讯混元大模型重构业务场景。刘煜宏表示,多模态正在加速到来,并将重构整个内容的产业,而基于多模态的应用也会呈现出百花齐放之势。
中央广播电视总台央博数字文化艺术博物馆总经理、央视网文体教育事业群总经理冯宇结合具体案例指出,大模型和数字人技术的结合将创造出更加个性化的数字人,从而实现“数字永生”。以少年李白数字人为例,与大模型结合后,他已经可以和观众流畅地进行对话和对诗,进一步提升了数字人的想象空间。
探索数字人+ 撬动产业新可能
随着5G、AI、XR等技术的发展,数字人作为虚拟现实与人工智能的结合体,正在逐步改变娱乐、教育、客服等多个行业的面貌,成为连接物理世界与虚拟世界的重要桥梁。
在“AIGC与视听演进”及“人‘人’共生的数字社会”两场圆桌会议中,来自大模型及数字人的头部公司相关代表围绕当下最前沿的技术和应用探索展开讨论。会议认为,AI技术加持下,当前数字人不仅在外观上越来越逼真,在情感表达和交互智能化方面取得了显著进展。这些数字人在虚拟世界中扮演各种角色,为用户提供各类服务,从网络视听领域到各类垂直场景,展现出广阔的应用前景。在技术和应用创新的同时,与会嘉宾还就如何推动AIGC与数字人的健康发展进行了深入讨论,论坛倡议聚焦AIGC及数字人应用的伦理、法律和版权问题,通过团体标准、行业标准、国家标准等,建立相应规范及法规,确保技术的可持续发展,并保护创作者和消费者的权益。
对此,中国传媒大学教授、媒体融合与传播国家重点实验室大数据首席科学家沈浩对此表示,人工智能大数据时代一定是科学和艺术的和谐统一,面对大数据、大模型,我们特别重要的是要生成未来,同时还要生成价值。这也意味着,行业不仅要关注未来生成价值,还要知道如何让数字人被AIGC和智能体复活,去寻找不同的场景。
案例+报告 提供行业启示
论坛同步发布了《AIGC网络视听应用先锋案例》(以下简称《案例》)及2024年度《中国虚拟数字人影响力指数报告》(以下简称《报告》)。
《案例》同步收录了23个来自国内头部科技公司关于视听领域的底层模型、解决方案及应用案例,为视听行业使用AIGC提供了工具、解决方案及范例。爱奇艺的奇声智能配音系统、哇嘶嗒科技的通用3D大模型TRIPO AI、网易云音乐科技的网易天音:音乐AIGC辅助生产平台、科大讯飞的讯飞智作数字视听平台、芒种星球科技的3D动作生成模型及动画视频生成平台、央视频的AI虚拟主持人生产力平台、右脑科技的Vega AI视觉创作平台、央视国际网络有限公司的“智策”媒体大模型、星河视效科技的视频自动化科技引擎、阿里云科技的AI数字形象互动应用解决方案入选TOP10。
《报告》由中国传媒大学媒体融合与传播国家重点实验室、中传数字人研究院编制,由中国网络视听协会、人民日报智慧媒体研究院、中国传媒大学动画与数字艺术学院、元力趋势网联合发布,分为研究背景、影响力报告、智能篇、应用篇、前沿观点与行业展望五部分,深入分析了国内虚拟数字人产业的技术迭代、应用场景、发展趋势及行业挑战,同时呈现了311个头部虚拟数字人样本2023年全年的传播数据分析及洞察。
据《报告》课题组组长张丽锦分享的数据,2023年度产业侧虚拟数字人行业持续扩容,“数字人、虚拟人”相关企业99.3万余家,其中年度新增相关企业41.7万余家,与2022年同比上涨超四成,主要分布在广东、浙江、山东、江苏、福建五省;技术侧,数字人企业抢滩AI趋势明显,国家知识产权局“专利检索”数据显示,2023年度数字人领域专利申请数高达544 个,发明专利申请约占专利总申请数的95%,反映出业界在核心技术研发上的强劲势头和深度创新。
来源:中国日报网