音视频技术：开启未来无限可能的大门

发表时间: 2022-08-15 19:02

近日，音视频技术领域的盛会LiveVideoStackCon 2022上海站圆满召开。大会聚焦在音频、视频、图像等技术的最新探索与应用实践，覆盖教育、娱乐、医疗、安防、旅游、电商、社交、游戏、智能设备等行业领域，音视频领域各大厂商的技术大咖们齐聚一堂，分享最新研究成果和实践。

华为云在会上分享了SparkRTC的技术探索、数字内容生产的实践及音视频如何赋能元宇宙的思考，获得现场听众的热烈反响。

华为云SparkRTC面向低时延、大通量传输业务的技术探索

华为云实时音视频架构师吴治宗分享了《华为云SparkRTC面向低时延、大通量传输业务的技术探索》，主要讲了未来互联网媒体演进的方向和现在存在的问题，以及SparkRTC的架构和如何应对和解决这些问题。

SparkRTC作为华为云实时音视频的底层网络，在核心的接入服务上，基于华为云全球DC做集中部署，同时在靠近用户地点部署媒体转发服务，在华为云边缘部署信令加速服务，保证用户接入的低时延。在技术上，一是通过接入网络把RTC能力分层开放，二是在互联网传输技术上基于华为Overlay技术构造低时延网络。这样的业务架构支持华为云从四个方面解决大容量低时延问题：

在基础设施层面，基于华为骨干网加速互联，性能大幅度提升，满足跨国互动需求；
在传输网络层面，底层RTN网络在原来IP报文基础上做overlay封装，实现快速路径规划，保障数据传输不丢失，达到最低时延保证；
在边缘加速层面，RTC信令接入上通过WebSocket over QUIC替换WebSocket over TCP，将7次握手优化成1次握手，信令接入时延降低65%；在云端转发方式上，通过SFU帧缓存减少组帧时延，一个SFU能带来5ms的时延优化；同时设定全路径测量协议，通过全路径逐段测量分析，得到实时通话质量。
在弱网接入能力提升上，通过算法优化和工程类优化得到网损情况下更高清晰度更稳定的实时音视频效果。

通过这些探索实践，华为云SparkRTC实现了跨大洲端到端时延200ms以内， SLA服务可用性高达99.99%。

华为云MetaStudio助力实现“数字人自由”

华为云媒体服务数字人领域研发主管陈曦分享了《华为云MetaStudio助力实现“数字人自由”》，介绍了华为云数字内容生产线MetaStudio提供的一系列基础服务，拉近了人们与“元宇宙”的距离。

当前的数字人制作存在很多问题嘛，比如成本高、周期长、标准不统一、驱动方案复杂、渲染成本高、智能化程度低等，MetaStudio提供的数字内容生产解决方案，在数字人领域提供了一系列能力KIT，如建模、驱动、渲染等能力，给伙伴很好的支撑，让伙伴可以基于这些KIT能力构建出丰富的行业应用。

华为云MetaStudio单照片风格化建模、多照片写实建模能力，降低了数字人的制作门槛；在传统动捕方案之外，视觉驱动方案和语音驱动方案降低了数字人的驱动门槛，同时，还能使用体采集更快速地生产真人3D视频内容，让伙伴可以更方便地建模、更简单地驱动、更高效地生产真人3D视频。

音视频技术如何赋能元宇宙

在《音视频技术如何赋能元宇宙》圆桌上，华为云视频云总监陆振宇说到：华为云媒体服务以云服务的方式提供3D模型建模、驱动等基础能力，然后通过网络架构层面的优化，如端云协同、云网协同、专用的算力和通用算力之间的协同，使建模、渲染成本降低，支撑“元宇宙”的落地。目前华为云在云展会，水务、电力等三维场景重建，广电媒资的3D空间技术等很多场景都进行了丰富的探索和实践，同时结合云手机、云桌面等服务，通过“元宇宙”的落地解决现实中的问题。

关注@华为云，了解更多资讯

音视频技术：开启未来无限可能的大门

热门阅读

推荐阅读