华为云媒体创新技术:引领音视频产业生产力的新篇章

发表时间: 2023-08-02 09:58

近日,LiveVideoStackCon2023上海站圆满举办,近百位行业大咖齐聚大会,从AICG、元宇宙、多媒体、传输网络等不同视角切入,覆盖娱乐、医疗、安防、旅游、电商、社交、游戏、智能设备等行业领域,分享音视频领域的当前技术发展,探讨未来趋势和前景。华为云媒体服务产品部多位专家受邀进行主题演讲,带来行业最新技术成果分享。

直播+X,突破时空限制,超越真实的内容体验

华为云媒体服务产品部副总裁陆振宇在《直播+X,直播行业新趋势》主题演讲中,分享了直播行业对新技术的需求和应用;在现阶段电商直播蓬勃发展、时空范围不断扩大、数字人直播盛行的大背景下,就华为云如何高质量地帮助客户在全球化语境下开展业务,为全球客户的业务提供服务展开了分享。

消费者在国内看视频、直播的时候,本质上是用的一个国家的一张网,在此情况下,都能达到不错的体验调优效果;但放眼全球,多个国家地区千差万别的网络质量、条件和业务场景,要实现良好的交流体验,构建一个分国家、分协议、自动化的数据驱动的调用系统很有必要。

华为在很多年前,就已经在为华为全球170多个国家的分支机构、消费者用户提供会议、畅联等实时音视频服务。华为云通过全球一张网的规划和落地,解决了本地覆盖问题;通过多拓扑网络平面选路算法,保障了跨区传输体验;基于WebRTC的低时延分发算法,将E2E时延<500ms,保障跨大区互联最优时延,确保用户最佳体验感;最后,通过流量级和应用级可视化、质量可视化、带宽可视化,解决全球运维效率问题,助力伙伴全球业务开展。

随着AIGC的发展,数字人直播盛行,如何在这个行业里服务好做业务创新的伙伴,降低算力成本和传输成本,以及如何降低技术使用门槛的问题。华为云的解决方案是MetaStudio数字内容生产线,通过模型制作、直播话术及一卡十路的能力,降低数字人直播入门门槛,解决有效运营及快速降本问题。

  • 伙伴通过API方式接入使用,可以高性价比、高质量的制作数字人;
  • 除了形象,还提供数字人预置音色、音色克隆、高保真音色克隆等音色服务;
  • 除此之外,华为云通过昇腾的算力、算力之上的模型层、数字人算法、渲染、推流到直播平台全套的解决方案,帮助用户快速实现生成式直播。

华为云MetaStudio,人人皆可拥有自己的个性化数字人

华为云虚拟数字人技术负责人李明磊分享《华为云MetaStudio多模态数字人进展及挑战介绍》,对数字人建模、编辑、驱动进行技术解读,深度阐述了数字人视频制作、直播、交互的流程,以及介绍了华为云数字内容生产线MetaStudio提供的一系列基础服务。提供数字人三种生成方式:

  • 文字生成数字人:输入对形象的描述,10s左右即可生成数字人,可以被后续驱动;
  • 照片生成数字人:一张照片,一分钟生成数字人;
  • 视频生成数字人:更多用于数字人直播场景,需要五分钟语料,训练3-6h,生成数字人形象。

华为云MetaStudio,大大提升了数字人的生产制作效率,在传统动捕方案之外,数字人单目驱动、数字人语音驱动表情和肢体、数字人情感风格肢体驱动让数字人的使用更加简单。

华为云渲染,助力渲染全场景业务迁移上云

华为云渲染服务技术专家陈普带来《华为云渲染实践》的演讲分享。据分享,渲染场景分为离线渲染与实时渲染两类场景。其中离线渲染场景主要用于影视、高清设计图等渲染场景。

华为云离线渲染AI加速,帮助客户在华为云的离线渲染业务提升渲染效率,显著降低渲染资源消耗。华为云云原生光追渲染服务,提供丰富的材质兼容,帮助家装设计类场景可以离线分钟级出高清渲染图,大幅度提升渲染效率。

实时渲染在数字人、数字人、虚拟展厅、工业等场景被广泛使用。华为云3D应用实时云渲染结合华为实时音视频服务,帮助企业将现有3D应用直接上云,客户端无需高级硬件即可以获得高质量流畅体验。

  • 华为云MetaEngine的实时渲染技术,支持物理真实的渲染、仿真、动画能力;
  • 实时光追渲染管线支持数字人、地形、水体、天气、植被等丰富的场景渲染,满足多场景制作的效果与性能,融合华为云多用户复用技术,还能够提升单机并发能力;
  • 华为云工业图形渲染引擎,可帮助CAD、CAE实现高性能工业可视化图形渲染与光追真实感渲染。

华为云媒体基础设施通过一系列创新技术,解锁更多新场景和新玩法,不断拓宽视频直播业务边界,实现更实时、更沉浸式的互动体验,重塑音视频产业生产力,赋能音视频产业新发展。


关注@华为云,了解更多资讯