元宇宙的“芝麻开门”由AIGC喊出

发表时间: 2023-01-15 20:02

来源 | 伯虎财经(bohuFN)

作者 | 陈平安

2022年8月,在美国科罗拉多州博览会上,一幅名为《太空歌剧院》的绘画作品赢得了数字类别的一等奖,但不少人对于这个奖项的授予并不服气。

争议并不源自作品的质量,而是这幅作品并不完全由画师个人完成。游戏设计师Jason Allen首先是通过AI绘图工具Midjourney生成原画,再经过Photoshop润色,从而完成了这幅作品。

这并非AIGC(人工智能内容生成)发展的孤例。就在月前,互联网刮起了一阵ChatGPT风,起因是OpenAI发布了一个全新的聊天机器人模型—— ChatGPT。和过去那些聊天机器人相比,ChatGPT不仅可以回答人类的追问,承认自己回答中的错误,拒绝回答不适当的问题,还能写诗和编程。根据外媒报道,有人甚至让ChatGPT为自己写论文并获得了及格。

连马斯克都忍不住感叹:“ChatGPT好得吓人,我们离强大到危险的人工智能不远了。"

当艺术界开始因为“AI绘画到底算不算艺术品”而吵得不可开交,当普罗大众对ChatGPT的对话能力惊叹不已,AIGC本身值得期待的就不再只是惊人的迭代和学习能力,而是作为一个生产力和生产工具的结合体,在生成内容维度和智能化程度上所展现的潜力。

破解元宇宙内容难题

一个公认的事实是,制约元宇宙相关产业发展的重要瓶颈,是内容生产上的不足。也许你会马上反驳,最大的障碍难道不是技术的不成熟吗?确实,当下无论是VR还是AR,交互技术和光学技术都无法达到大多数人对元宇宙期望的那样。

但元宇宙相关产业的落地和发展并不完全依赖于这些硬件,无论是数字人还是元宇宙第一股Roblox都足以证明。

元宇宙当前最大的挑战反而是在内容侧,如何提供能够满足各行各业需求的高质量内容?

以数字人为例,"拟人化"和"自动化"是判断一个数字人等级的标准。在这个标准下,数字人被分为了L1-L5五个等级。其中L4级别的数字人能够实现部分智能化交互;L5级则能够实现完全智能化交互。从L4级别开始,数字人能够逐渐替代真人去完成服务。

(来源:商汤智能产业研究院)

这也意味着,数字人产业的突破,和L4及以上级别的数字人能否量产息息相关。但一般一个数字人的生成需要经过模型重建、动画准备等多个过程,制作流程长达数月,这种生产力上的不足也严重制约了数字人的普及。

AIGC正在成为打破这道瓶颈的关键。

从2016年创造SenseMARS平台时,AI龙头商汤科技就开始从全景智能的角度布局AIGC各种能力。

到目前为止,商汤不仅在计算机视觉方面积累了超过49000个算法模型,覆盖从视觉信号的分析理解到实现数字内容的生成等各方面;也自研并具备了包括语音识别(ASR)、语义理解(NLP知识图谱)、语音合成(TTS)以及语音动画合成(STA)等多项技术能力。

通过这些底层AI技术的迭代,商汤几乎重塑了数字人的整个生产流程。

(来源:商汤智能产业研究院)

在传统 CG 建模环节里,商汤推出的智能化生成引擎可以基于少量照片的面部扫描,算法自动生成高精度的3D 面部模型,大大减少了建模环节的投入和时间成本。

智能化驱动引擎则通过STA等算法加速协调数字人的拟人化程度,让其整体动作表现更加自然,减轻了画师的工作强度和人工成本。

而在决定数字人"自动化"的多模态交互和深度学习能力构建环节,智能化交互引擎专注于提高数字人的智慧性。基于语音识别(ASR)、语音合成(TTS)、自然语言理解(NLP)等技术组合,结合商汤所积累的海量特定知识领域的知识问答库,数字人不仅可以和用户快速高效的建立对话关系,还能实现自身的深度学习和迭代升级。

同样的例子在游戏产业也有所体现。

游戏是业内公认的元宇宙雏形之一,但当下游戏产业发展的桎梏也很明显,即内容创新。传统开发存在明显的智能上限,这使得游戏很难持续为玩家提供情绪价值。在此条件下,游戏厂商们要么持续投入大量资金做内容建设,要么等待下一个天才策划或者玩法的出现。

也因此,能够快速、高质量产出内容的AIGC被视为了破局的关键。2021年商汤成立了智慧决策与游戏事业部,推出了SenseMAP。这款集合了商汤深度学习、智慧决策等前沿的AI技术的产品几乎涵盖了游戏开发的整个流程。

在游戏生态上,SenseMAP不仅能够通过真实玩家游戏数据训练NPC,让其具备类似真实玩家的游戏行为,还能让其和普通玩家进行互动。

在内容生态上,SenseMAP支持角色设计、动作捕捉、人脸3D生成等多项功能,大大降低了角色的生产周期,满足玩家的UGC需求。

随着AIGC的发展和普及,过去那些耗费巨大的知识性和创造性工作的边际成本将大幅降低,过去制约元宇宙相关产业发展的内容问题将迎刃而解,从而产生巨大的生产效率和经济价值。

可以预见的是,AIGC正站在元宇宙的石门前,喊出了那声“芝麻开门”。

AIGC何以被点燃?

AIGC的本质是内容与场景,需要AI与后端基建,也就是算法、数据和算力共同生成。当下,AIGC正朝着更强、更快、更低成本的方向发展。

一方面,随着AI模型的通用性不断提高,AIGC应用的门槛在降低,效率却在进一步提高。

2015年以前,小模型被公认为是AI模型的最优选。这是因为小型的模型对于硬件的要求较低,同时和大模型相比,小模型具有更高的可解释性和稳健性。但小模型的缺点在于,对通用任务的处理表现并不好。换言之,他们很难针对特定领域或者场景去进行定制。

在这个背景下,大模型脱颖而出。大模型可泛化能力强,可以做到"举一反三",同一模型利用少量数据进行微调或不进行微调就能完成多个场景的任务,从而摆脱小模型应用碎片化、作坊式开发的特点。

这为AIGC进入新阶段提供了契机。以商汤为例,剖析其技术基座,商汤元宇宙主要基于SenseMARS火星混合现实平台打造,目前该平台内含3,500个人工智能模型,包括感知智能、决策智能、智能内容生成(包括增强现实、混合现实)、软件智能体及其他基础设施(如云引擎等)。

基于SenseMARS,商汤能够针对不同的行业拿出的方案,从而实现元宇宙相关产业的广泛应用。前文提到的数字人就是典型案例。商汤打造的AI数字人不仅在逼真程度上媲美真人,而且更聪明,能够"听得懂,看得见,说得出",很重要的原因在于商汤的AI数字人是由三种引擎(算法)共同打造的。

另一方面,算力、算法模型等后端基建相关的基础设施建设加速了大模型的生产迭代,这为AIGC的广泛应用打下了基础。

爆火的ChatGPT能够实现当前的交互,就离不开OpenAI在AI预训练大模型领域的积累。从2018年起,OpenAI就开始发布生成式预训练语言模型GPT,可用于生成文章、代码、机器翻译、问答等各类内容。

在这股预训练大模型的风潮之下,是一场拼参数、拼算力的军备竞赛。2018年,GPT的参数量还只有1.17亿。随后几年,OpenAI每一代GPT模型的参数量都爆炸式增长。到2020年5月,新发布的GPT-3参数量直接暴涨至1750亿。

AI模型对算力的需求在过去短短几年内翻了大约100万倍,平均每年十几倍,这个增速甚至超过了对算法精度增长的需求。

算力即最核心的生产力。如何把握住驱动AIGC的根本源动力?商汤的人工智能基础设施SenseCore AI大装置在更早时候已给出了答案。

资料显示,SenseCore商汤AI大装置的核心由计算基础设施、模型层、深度学习层三个部分架构而成,分别对应算力、算法模型生成和算法模型训练三个要素。

2022年,商汤在上海临港的智算中心AIDC正式运营,是亚洲最大的人工智能智能计算中心之一。得益于磅礴算力的加持,模型层中的商汤的SenseSpring“模型工厂”能够快速生成稳定可靠的模型,截至2022年6月,累计生产近50000个商用人工智能模型。

ChatGPT本质上是基于NLP大模型落地的应用。而基于SenseCore,在视觉大模型领域,商汤已训练和构建了超过300亿量级模型参数超大基模型,得以有效支持AIGC的应用。

商汤2022年中报透露,公司在ImageNet大规模识别任务中实现超90%精度,和Google、微软共同跻身世界前三。

在SenseCore的助力下,算法模型在快速生成和迭代的同时,成本也在降低。

据商汤中报披露,基于大模型的自动数据生产线不仅将数据自动标注速度提升到了传统人工的600倍,成本也降到了过去人工的1/500,且标注精度与人工水平一致。

通过SenseCore商汤AI大装置强大的算力基础和领先的算法能力,商汤能够以高效、自动化、集约化的方式,让高质量的AI算法实现“量产”,从而进一步拓展AIGC的应用范围。

毋庸置疑,属于元宇宙的黄金时代已经初见端倪。

元宇宙未来已来

尽管《头号玩家》那样的元宇宙看起来离我们还很遥远,但是元宇宙和我们生活的联系远比我们想象的要紧密。

在广州悦汇城周年庆的现场,越秀地产联合商汤推出AR Show,游客们可以看到冰龙在上空盘旋,梦幻逼真的冰雪城堡,还有从天而降的红包雨等。

这无疑为顾客提供了一种全新的互动方式,也重新定义了"商业空间"的概念。在悦汇城周年庆活动期间,AR Show助力广州悦汇城全场销售额同比增长196%,客流增长超过开业同期。

一些我们熟悉的服务场景也在元宇宙的加持下发生了变化。宁波银行上海分行就有一位特殊的大堂客服经理——商汤科技基于"AI数字人服务中台"为宁波银行专属打造的数字人员工小宁。

据了解,小宁不仅可以对前来办理业务的顾客给予主动问候和自动接待,并通过专业、自然的交流互动,提供各类业务咨询和问题回复,还能针对客户需求进行自动化引导和智能分流。

日前,小宁“首次亮相直播平台,这也是商汤科技AI数字人”虚拟IP在线上营销场景中的首次应用。

事实上,元宇宙相关产业的商业化路径正逐渐清晰,早早布局的商汤凭借先发优势显露头角。

在线上元宇宙方面,商汤已实现软件向SaaS模式的升级,连续6年实现市场份额增长,市场份额蝉联第一。

商汤生产的交互式AI数字人,在文旅、展馆、金融、教育、商超等实体产业中广泛应用。与此同时,商汤在2022年与敦煌文创、徐悲鸿美术馆等合作生成顶级IP数字文创产品,并发行超2万个限量版数字藏品。

商汤同步深度布局线下元宇宙场景,以签约运营的商业模式,落地了百余个海内外元宇宙项目,累计生成超过一千万平米线下场景。

仅商业零售元宇宙领域,商汤与中国电信合作赋能400多家商业综合体。在北京富力广场、上海虹口凯德mall、武汉万象城、郑州正弘城,商汤的商业空间元宇宙应用正在为线下商业带来新的突破点和增长点。

更直观的表现则是,商汤2022年中报显示,包含元宇宙业务的智慧生活板块上半年营收同比增长98%,占总收入的21%。

Gartner预测称,到2026年,全球30%的企业机构将拥有用于数字人和元宇宙的产品与服务。未来AIGC存在规模化变现的潜力。麦肯锡则预测,到2030年全球元宇宙相关支出或达5万亿美元。

在这场或许比移动互联网更加颠覆的大变革里,靠着布局和技术的领先身位,商汤有望迎来新的增长曲线。

*文章封面首图及配图,版权归版权所有人所有。若版权者认为其作品不宜供大家浏览或不应无偿使用,请及时联系我们,本平台将立即更正。