深圳再现LiveVideoStackCon,2024音视频技术发展报告正式发布

发表时间: 2023-11-24 21:02

大约1400多天前,LiveVideoStackCon首次来到深圳。和今年一样,那一年我们也交付了三场大会,只不过今年的第一场北京站其实是2022年延期而来。那一年非常疲惫,也非常幸运。如果不是2019年有过第一次,大概率今年也不会来深圳了,这可能是无法弥补的遗憾。

正如大家感受到的一样,多媒体生态的困局投射在每一名从业者身上。你不可能改变行业的急转直下,正如不可能改变当初千播大战、疫情点燃整个行业一样。你可以随口抱怨几句,继续行动。今天的LiveVideoStackCon正是在这样的局面下交付给大家的,算不上最精彩的一次,但同样是付出了团队心血的,诚意满满。

接下来推荐一些个人认为有独创性的议题,这种从经验和统计学出发筛选的推荐内容,对于单个读者的价值非常不稳定,建议大家直接参考大会官网的讲师信息和议题描述,根据个人需求自行判断。免责声明完成,那我们开始。


主题演讲:

《概述AVM的编码工具》 陈诚/Google

推荐这个话题的理由有二。首先,这是过去四年间唯一一名来自海外(线下参与)的讲师。其次,AVM就是AOMedia的下一代视频编码标准,大概率会在2024年发布。尽管国内多媒体生态依然被ITU和ISO/IEC这些传统老牌组织的标准牢牢统治,但AV1已经在海外成为新的共识,受到空前的关注和应用。随着苹果在AV1/AVM上投入不断加大,也为AV1/AVM成为行业事实标准做好了铺垫。


专场:

《抖音背后的体验增长实战揭秘》

无论在国内还是在全球,字节是少数几个还在增长的重度应用视频的巨头,他们的一举一动当然值得关注,他们的经验也值得参考。本专场会围绕业务增长、体验、成本等关键维度,涉及直播、RTC、网络优化、后端流媒体流水线架构、AIGC等。你可以通过以上海报的二维码报名。


数字化与行业案例:

《突破边界:低延时视频技术的应用场景与挑战》 扶凯/秒点科技

作为老朋友,扶凯早在2017年就在第一届LiveVideoStackCon做了分享。如今作为一名创业者,他和他的团队正在探索将流媒体技术应用于企业协同、远程导播台、云电脑等SaaS场景,他所面临的各种挑战与思考可能正是你需要的。


降本增效

《希沃智能语音的低成本落地实践》 李波/希沃

李波是希沃AI团队的leader,也是智能语音技术的研发主力,目测内容会非常干。


网络优化实践:

《元象RTC云网端协同技术的演进》 涂承杰/元象

《端到端Low Latency HLS低延时方案》 汪立民/微帧科技

涂承杰和汪立民都是我们非常期待合作的技术专家,而他们也非常低调,能够邀请他们来输出内容实属幸运。涂承杰此前是腾讯、Uber、高通、微软等公司视频编码专家。汪立民可能是我接触了唯二最低调的技术专家(另一位是爱奇艺的王志航),2017年就与他相识,足足用了6年时间邀请他出山。


AI与多媒体:

《芒果TV长视频内容理解检索与应用创新》 郑孝直/芒果TV

芒果TV可能是在国内的同行中拥有最大规模的技术团队,历来重视技术、尊重人才,他们在媒体内容制播、商业化等方面处在领先地位。郑孝直这个话题也是所有长视频平台无法绕过去的挑战,直接关系到降本与效率。


音频新体验:

《座舱音频系统的架构设计和音频体验》 高林/蔚来

音频创新的场景很多,但很难有另外一个场景的潜力超过智能座舱吧。作为造车新势力中的一员,蔚来在智能座舱音频应用的探索和经验应该值得关注。


元宇宙:

《AR协作的思考与实践》 唐荣兴/亮风台

唐荣兴是国内首批AR创业技术人,一走来已经超过了10年。由他来总结AR协作这个话题是非常适合的。唐荣兴经历了传统通信、移动通信、互联网通信的过程,他的这些经历也让他对协作有更深的认识。


QoE与数据驱动

《水下图像质量评价与画质增强研究》 赵铁松/福州大学

我选择了一个看上去非常冷门的场景——水下图像的质量与增强,但是个人认为这将是一个很有前景的领域,毕竟我们对水下世界的了解还非常有限。


视频编解码与AI:

《面向内容感知的超高清视频实时编解码技术》 孟现东/鹏城实验室

《JPEG AI图像编码标准进展和应用》 赵寅/华为

《端到端图像视频编码及其标准化》 李礼/中国科学技术大学

这是一个神仙打架的专题,推荐起来非常困难,推荐这三位只是因为议题中的某个细节打动了我,并不代表其他议题不够出色。这三个话题分别从AI端到端视频编码工具与传统编码框架融合的混合编码方式、AI图片端到端编码以及AI编码的标准化三个角度切入,非常有代表性。


多媒体商业探索:

《未来音频》

《AIGC商业化落地》

《音视频通讯协作的过去、现在和未来》

多媒体商业探索是圆桌形式的自由讨论,你可以与嘉宾直接提问互动。设立这个专题的初衷就是为了探索多媒体的未来场景和商业化机会,而这正是我们这个领域十分欠缺的。


AIGC与内容生产:

《美图AI动漫功能的落地探索》 李骈臻/美图

《XMusic:多模态可控的高质量通用作曲框架》 田思达/腾讯

AIGC被认为是可以帮助多媒体领域很好的解决内容生产的瓶颈,可以大规模低成本的输出内容,但当下最大的挑战在于将AIGC应用在具体的商业场景上,这就对技术的鲁棒性、成本提出了更高的要求。以上两个话题都是具体应用场景下的AIGC探索,值得学习。


浏览器:

《WebCodecs 开启 Web 音视频新篇章》 刘俊/哔哩哔哩

WebCodec是浏览器上与流媒体相关的非常重要的能力更新,有望彻底解决编解码这种高算力场景需求,从而替代传统的WebAssembly方案。


IoT与多媒体:

《混合现实影像在音视频会议领域的应用实践》 陈宇/视熙科技

《万物云RTC技术演进的关键时刻》 张自豪/万物云

《在嵌入式低资源系统中实现高效音视频播放》 张丙儒/RT-Thread

这三个话题都来自创业团队,都在通过自己的方式探索流媒体与IoT结合的创新机会。

另一个足够幸运的是,我们完成了首次音视频技术发展报告发布,这是一份酝酿了5年多的报告,感谢团队的坚持,几百位参与了报告调研的行业用户,几十位技术专家为报告输出了关键信息与专业审校。

在这份《2024音视频技术发展报告》中,主要讨论了2个问题:当下国内的音视频技术生态的现状,以及未来的发展方向。

现在你可以扫码或者点击阅读原文获取这份报告,如果你发现报告中有任何错误或欠妥之处,请联系我们 contribute@livevideostack.com 。

最后,预祝大家有两天充实的参会之旅。