近日,音视频技术领域的盛会LiveVideoStackCon 2022上海站圆满召开。大会聚焦在音频、视频、图像等技术的最新探索与应用实践,覆盖教育、娱乐、医疗、安防、旅游、电商、社交、游戏、智能设备等行业领域,音视频领域各大厂商的技术大咖们齐聚一堂,分享最新研究成果和实践。
华为云在会上分享了SparkRTC的技术探索、数字内容生产的实践及音视频如何赋能元宇宙的思考,获得现场听众的热烈反响。
华为云实时音视频架构师吴治宗分享了《华为云SparkRTC面向低时延、大通量传输业务的技术探索》,主要讲了未来互联网媒体演进的方向和现在存在的问题,以及SparkRTC的架构和如何应对和解决这些问题。
SparkRTC作为华为云实时音视频的底层网络,在核心的接入服务上,基于华为云全球DC做集中部署,同时在靠近用户地点部署媒体转发服务,在华为云边缘部署信令加速服务,保证用户接入的低时延。在技术上,一是通过接入网络把RTC能力分层开放,二是在互联网传输技术上基于华为Overlay技术构造低时延网络。这样的业务架构支持华为云从四个方面解决大容量低时延问题:
通过这些探索实践,华为云SparkRTC实现了跨大洲端到端时延200ms以内, SLA服务可用性高达99.99%。
华为云媒体服务数字人领域研发主管陈曦分享了《华为云MetaStudio助力实现“数字人自由”》,介绍了华为云数字内容生产线MetaStudio提供的一系列基础服务,拉近了人们与“元宇宙”的距离。
当前的数字人制作存在很多问题嘛,比如成本高、周期长、标准不统一、驱动方案复杂、渲染成本高、智能化程度低等,MetaStudio提供的数字内容生产解决方案,在数字人领域提供了一系列能力KIT,如建模、驱动、渲染等能力,给伙伴很好的支撑,让伙伴可以基于这些KIT能力构建出丰富的行业应用。
华为云MetaStudio单照片风格化建模、多照片写实建模能力,降低了数字人的制作门槛;在传统动捕方案之外,视觉驱动方案和语音驱动方案降低了数字人的驱动门槛,同时,还能使用体采集更快速地生产真人3D视频内容,让伙伴可以更方便地建模、更简单地驱动、更高效地生产真人3D视频。
在《音视频技术如何赋能元宇宙》圆桌上,华为云视频云总监陆振宇说到:华为云媒体服务以云服务的方式提供3D模型建模、驱动等基础能力,然后通过网络架构层面的优化,如端云协同、云网协同、专用的算力和通用算力之间的协同,使建模、渲染成本降低,支撑“元宇宙”的落地。目前华为云在云展会,水务、电力等三维场景重建,广电媒资的3D空间技术等很多场景都进行了丰富的探索和实践,同时结合云手机、云桌面等服务,通过“元宇宙”的落地解决现实中的问题。
关注@华为云,了解更多资讯