文 | 阑夕
在音视频这个技术领域,腾讯可能还真是中国互联网里历史最为悠久的公司,没有之一。
早在2002年,QQ就上线了视频聊天的功能,相当超前的为用户带来了实时影像交流的体验,弹视频/语音也成为了QQ社交的一种可选项。可以说QQ视频是腾讯第一次由虚向实的尝试,让用户可以明确看到聊天窗口的对面,有着一个何等真实的陌生人。
那时中国个人电脑的主流操作系统还是Windows 98,网民数量也只有不足6000万人,所有的内容平台都还是以图文为主——如果有人发了比较多的图片帖,默认的礼仪是要在标题上注明「多图」,否则便很容易收到因为浏览器卡死而回复的怒骂。
在所谓「小水管」的带宽时代,腾讯投建音视频技术的原因,莫过于它的社交基因驱使自己必须跑在产业均值的身前,在同步传输比特信息的过程里,覆盖音容笑貌这个最大的数据流。
20年的时间转瞬过去,音视频几乎成为了所有社交产品的标配,它也作为一种基础能力被放在了腾讯云的架构里,不但支持公司内部的各条业务线,也对外输出给所有的合作方,但与20年前不同的是,音视频在今天早就脱离了专供互动娱乐的狭义定义,在「通个语音」「打个视频」的底座之上,音视频正在互联网之外的千行百业大放异彩。
这是一项可能还要持续20年以上的宏大工程,贯穿前后两个时代的,是数字经济和实体经济骨肉相连的不可逆趋势,革故鼎新的故事,始于每一个新技术的应用和落地。
· · ·
某种意义上,音视频作为全真互联的技术底座,是连接数实融合这个抽象概念的最可见之处,因为音视频的一切场景,都体现在前端交互的体验里,有没有做好,以及做的效果怎么样,用户一目了然,甚至都不需要数据去做修饰。
在宁波舟山港的梅东码头,腾讯云音视频联合合作伙伴飞步科技,建成了全球规模领先的自动驾驶车队,不需要安全员就能完成精准对位作业,助力港口24小时不间断高效作业。
通过具有模拟方向盘的远程驾舱可以在办公室驾驶位于港口现场的无人卡车,一方面实现了自动驾驶车辆远程介入接管,解决了安全员无法下车的问题,另一方面实现了1人同时看管多车,把人效提高了数个档位。
在这个场景里,音视频技术解决的问题就是把摄像头等传感器的数据低时延发送回来处理,系统需要知道卡车「看到了什么」才能持续远程操控,这对精度要求极高,一旦信息传得迟了或是不准,就会搞砸一切。
依托腾讯云实时音视频TRTC技术,从相机采集现场画面、完成编码,再传输到远端驾驶舱解码、渲染,对全流程进行优化,将时延降至100ms以内,并和多网聚合技术进行跨层优化,从根本上解决弱网问题,实现远程控制画面「0」卡顿的丝滑体验。
远程医疗的发展也为优质医疗资源的普惠化提供了更好的途径,西门子医疗就基于微信小程序和腾讯云实时音视频TRTC打造了一系列极具中国特色的基于5G的远程医疗应用,基本覆盖了从放射扫描助手到远程放射专家再到远程介入大师以及远程放疗计划等资源。有效解决了偏远地区的医疗资源分配不均、医疗设备检测或扫描拍片缺乏专业技师人才储备等问题。
2022年7月西门子医疗也建立了数字指挥中心,支持全国400多家医疗机构实现远程扫描指导和远程介入指导服务,充分发挥了公立大型医院的医技力量,提升了乡村县镇这些医疗技术水平实现了分级诊疗制度的有益尝试。最近一年以来,腾讯云音视频联合西门子支持了2.7万次的远程扫描服务,包括全国424家医疗机构的CT、核磁和PET。
事实上,从去年开始,全国就有多家三甲医院通过腾讯云视立方TUICallkit组件快速上线了远程医患问诊服务,接待了更多有需求的患者。不止于此,腾讯云音视频还支持多科室线上会诊、远程影像检验、规培会议等多个医疗场景。
这些应用落地,看起来都像是「视频聊天」的升级版,只不过在这种核心能力的方向演变化上,音视频技术终于等到了基础设施整体成熟的时机。
比如5G通信的速率提高,比如工业设备的数字化升级,比如云端计算的算力跃迁,有了来自时代的突破,才有落到时机的成熟,这正是中国科技产业过去几十年来突飞猛进的一个缩影。
· · ·
YC的创始人、硅谷投资教父保罗·格雷厄姆在代表作「黑客与画家」里写过这么一段话:
「世界上有益的痛苦,也有无益的痛苦。你需要的是咬牙向前冲刺的痛苦,而不是脚被钉子扎破的痛苦。」
对于传统企业来说,面对数字化转型的心理挣扎,就像这段话所描述的一样,又爱又怕。
爱的是转型确实是刚需,转了不一定成功,不转一定不会成功,没人否认数字化的未来,但怕的却是信息不对称,容易投入巨大却始终找不到那双合脚的鞋子,明知有金矿在前,卖铲子的铺子实在是太多了。
从数字化切换的大浪潮来看,音视频技术只是其中一朵浪花,只是见微知著,这朵浪花因其显性而排序靠前,如果它是第一个拍到岸边的,那么也会在最大程度上决定在岸者对于这片海水的感知。
是冷的还是暖的,是蓝的还是灰的,是有用的还是徒劳的,是增长还是内卷。
腾讯云给蒙牛做的方案,很有代表性,蒙牛是中国领先的乳制品供应商,因为消费者都在线上活跃,所以蒙牛对互联网的热情极高,希望和年轻用户建立除了电商卖货之外的更多关系。
但这不是蒙牛甘于止步的边界,这家公司还想踏入营养健康领域,为可能新增的潜在业务打好铺垫,此时,就轮到腾讯云音视频用腾讯在消费互联网行业负重前行数十载积累下来的方法论,来为传统行业和实体商业修桥补路了。
在日前举办的蒙牛全球合作伙伴答谢会上,蒙牛健康营养师「蒙蒙」作为行业内首个可交互AI「智能营养健康专家」,将基于蒙牛「WOW 健康 +」小程序为消费者带来多场景、多功能的健康服务,实现更立体、更有温度的情感交互体验。
在蒙牛「WOW 健康 +」小程序上,腾讯云音视频基于自身在通信CPaaS领域的多年积淀,通过即时通信IM与云联络中心TCCC联合打造的 IM 客服插件,采用业界领先的即时通信IM+在线客服+用户自建AI模型模式,充分整合营养健康领域模型MENGNIU.GPT与腾讯云音视频优质的IM+在线客服的组合能力,助力蒙牛打造智能营养健康服务体系,以场景式健康顾问更好地连接消费者。也让人工智能技术与行业场景实现深度融合,推动乳制品行业数字化转型升级。
这就是音视频技术带给企业数字化的绝佳示范,不是为了数字化而数字化,所有瞄准的地方,都是企业以往所想却不能及的事情,在人力有时而穷的时候,机械降神。
· · ·
传播学家麦克卢汉说人类总是通过后视镜来观察前方,「我们实际上是倒着走向未来。」
考虑到麦克卢汉的玄学风格,对他这句话的理解版本很多,但尼葛洛庞帝的解释是最让人感到信服的,他说那些早期歌颂互联网的人,就像是对爬山感到兴奋的新手,但他们都没有遇到缺氧,着只能说明,所有人其实都还在山脚,距离想象中的山顶尚且非常遥远。
就像一百年前,人类就在设想会飞的汽车了,很多科幻小说和时尚杂志都乐观预测二十世纪末就能在纽约上空看到遮天蔽日的汽车队列,随着时间的推移,这幅畅想中的图景也就成了后视镜中的画面,科学家和工程师们还在为之努力奋斗。
关于音视频技术的预期,我在之前的文章《音视频的火,烧到了传统行业的腹地》里也提到过,早在几十年前的文学或影视作品里,我们就接受了一个音画实时同步的未来,在「安德的游戏」里,坐在电脑前就能开飞船打外星人,在「攻壳机动队」里,人们聚在一起开会的方式就是全息投影了,而在真实世界,像是腾讯云音视频这样的平台还在日以继夜的把这些提前构想出来的效果逐一实现。
当然了,和文艺创作相比,未来总是会以最接地气的方式出现。
腾讯云音视频在中国视频云解决方案市场已经连续霸榜五年第一,它的客户群体肉眼可见的在向外破圈,从泛互联网公司转向多元化的传统公司,尤其是在金融、医疗、工业、广电、文旅这些积重产业。
这类公司的数字化转型特点,都对「所见即所得」有着极高需要,比如银行的网点成本消耗巨大,用户也不喜欢动辄就要取号排队,在搭建了虚拟营业厅后,用户的大部分需求都可以在手机上完成,甚至连面签都有数字员工来一对一的提供对话服务。
这些都在客观上为音视频行业树立了一道标准,那就是只有为客户创造了增量机会,才能在企业级市场拥有长效的订单,支撑起那棵繁茂的场景之树。
· · ·
从周期的角度来看,中国互联网的繁荣兴盛,离不开实体经济的哺养之恩,电信基站的高密度建设,成就了移动流量的迅速爆发,制造业的灵活产能,供应了电商渠道的巨量货源,城市化的集中规模,更是编织出了即时配送所需要的人力网络,为线上消费创造出了全球领先的条件和环境。
也是时候让互联网行业在突飞猛进的过程里攒下的高新技术资源,来回报实体产业的多年支持了,数实融合不是一句空话,而是一种价值,动能切换的价值。
可以预见,这是下一个20年的故事开头。
而AI的迎面大浪,也只会进一步加速数实融合的过程,以大模型为基底,任何企业都能用相对可控的成本跑出一个属于自己的精调模型,这种能力最终会体现在可视、可听的互动关系里,这正是腾讯云音视频早早摆放棋盘的位置。