探索AIGC桌面端算力的新趋势

发表时间: 2024-06-05 15:42

这两年AI大模型正在遍地开花，并且各家也在不断探索实际的落地场景，其中视频生成算是当下的热门领域。

C端，有我们前面讲过的图生视频大模型App，一张照片就能生成自定义的舞蹈视频。B端，大模型也在逐渐融入到影视行业的制作流程中。

就在今天，算力方案提供商宁畅发布了首支由AIGC生成的微电影——《宁畅星球：算力之战》。简单来说，这部片子的剧情主要讲述了，未来的地球文明在AI算力的加持下高度繁荣，然而外星侵略者觊觎地球的算力，由此展开了一场未来人类与入侵者之间的算力争夺大战。

虽然剧情叙事比较简短、单一，但我们看下来还是觉得这个活儿整得挺好的：

一方面，片子中的AI人物角色以及场景设定都参考了宁畅自己的产品（工作站&服务器），并且做出来的效果确实挺炫酷的，看得出来是用心了，不是那种硬套模板的货色。

另一方面，宁畅提供算力支持。作为B端算力方案提供商，宁畅在推出AI工作站时，更加注重与用户的使用场景进行结合，通过AIGC微电影的这种形式来告诉目标客户：“用我们的机器就能够创作出类似的效果。”

除此之外，宁畅在今年3月份的时候还发布了他们的“全局智算”战略，用来帮助企业级的AI应用落地。

可以这么说，如今推动AIGC产业的实际落地，已经是AI工作者、企业以及算力提供商们的一致共识。

其实早在宁畅发布这部微电影之前，我们就已经看过很多使用AIGC创作的短片作品了。比如之前B站UP主特效小哥就尝试过，只花5天时间利用AI在快速地创作出一条1分多钟的CG短片。

他们通过文本大模型来创作剧本，利用Stable Diffusion（图像生成大模型）来提升画面丰富程度，再用AI动捕来替代传统的惯性动捕，最后配合人工的建模和剪辑，创作出了这条效果还不错的CG短片。

在这其中，AI的作用主要还是减少了很多重复繁琐的操作，让特效小哥的团队可以专注于创意和细节方面，不然很难在短短5天内完成这么一支画面稳定、故事完整的CG短片。

再比如，像今年的第十四届北京国际电影节还首次开设了AIGC单元，涌现了一大批优秀的AIGC短片。而像Netflix这种流媒体平台也于去年制作了首支AIGC动画——《犬与少年》。

现在的AIGC影视作品，早已不是过去那种的“小打小闹”，接下来的目标是拿电影节大奖，以及做成真正可以给观众欣赏的作品来变现。

在这个背景之下，我们发现这场新时代的AIGC“淘金热”有愈演愈烈的趋势，而在这个狂热的年代里，“卖铲子的商人们”也在想着怎么从中分一杯羹。

不过，这个“卖铲子”的生意这两年可不太好做，因为实在卷得太厉害了。基础大模型领域有“百模大战”，前不久我们才刚写过国产大模型都在争“地板价”；而算力底座领域也是“神仙打架”，根据行业的不完全统计，仅2023年全国新建的智算中心项目就超过100个，总建设规模成本以百亿计算。

前面没跟大家解释清楚，可能有些朋友不太明白这个智算中心的作用。所谓智算中心，其实全称应该是人工智能计算中心，它由数以千计甚至数以万计的高性能GPU计算卡构成，可以提供强大的算力支持，既能拿来训练AI大模型，又能用来做影视后期的渲染工作。

而在各家打得火热的同时，开头提到的那家厂商宁畅，基于自身对于AI算力领域的深耕和理解，发现了一个新的方向，或者说是新的需求——不同发展阶段、不同业务的客户对于AI支撑能力有着越来越复杂的需求，不能再像以前那样粗放式的“堆卡”“堆算力”了。

基于这个需求，宁畅给出的答案是“全局智算”战略，通过“全栈全液”AI基础设施方案，来为智算中心的构建和大模型的落地提供有力的支撑。

我们分析了一下这个方案，发现它有两大特点：一个是更加精细化，有数据指出目前整体算力的利用率大概只有30%，存在比较严重的资源浪费情况，所以宁畅从计算、存储、网络、建设、管理、应用以及液冷等方面，去充分地提升算力的利用率，推进算力朝着高质量的水平发展。

另一个是提供全流程、全场景的定制化服务，打个比方：在设计AI集群方案之前，宁畅会先咨询客户需求，把需求聊透了，再根据客户的业务场景、发展阶段、成本预算等等，来给出更具实用性和适用性的方案。

说起来，宁畅这家成立于2019年的年轻企业，之所以能够在老牌林立的服务器行业中杀出一片天，在2023年全年中国液冷服务器厂商市场中份额排名前三，主要就是因为他们有明锐的市场洞察以及灵活的服务器定制化服务。

所以，当已经在AI算力领域早有布局的宁畅提出“全局智算”这个战略后，我们可以看出，宁畅的野心确实有点大，他们想要在AI算力争夺战中拔得头筹。

不过，既然是全局智算，那么宁畅自然也不单单只着眼于构建大企业所需要的AI全栈能力，于是他们又把目光看向了中小企业的算力需求。

目前宁畅的AI算力栈是由128台GPU服务器组成的千卡算力集群，虽然他们有不同的算力方案给客户选择，但对于中小企业来说，他们的算力需求可能没有那么高，也没有那么多经费去跑那么多次的云计算推理，所以用电脑或者工作站来开发和部署本地AI大模型，是一个比较有性价比的选择。

在看准了这点之后，宁畅就推出了咱们前面提到的AI工作站W350 G50，用来补上“全局智算”的重要一环。

这台工作站能以桌面终端的形态提供强大的算力，因为它的GPU可选NVIDIA RTX™ 4000 Ada & RTX™ 5000 Ada。跟游戏显卡不同，RTX™ 4000 Ada & RTX™ 5000 Ada这类专业图形卡，支持的OpenGL驱动更加全面，可以很好地兼容各种工业3D设计软件。

其中RTX™ 4000 Ada能够以单槽PCI-e结构能提供出色的性能和功能，对于专业人员来说，在进行创作、设计以及工程等工作流的时候，能够提供更好的流畅性和图像渲染效果。

而RTX™ 5000 Ada 采用了 NVIDIA Ada Lovelace 架构，在AI性能上有了很大突破，相比前代（RTX™ A5500），它的AI推理能力提升了2倍，生成式AI能力提升了1.5倍，并且还有32GB的大显存，基本可以满足AIGC创作以及各种专业工作流的需求。

在处理器上，W350 G50搭载的是英特尔至强W-2400和W-3400系列，最高可以选择56 核心112线程版本。不同于消费级的酷睿系列，企业级的至强CPU专为高端计算和数据中心而设计，拥有更强的单核和多核性能，可以更好地满足复杂的计算任务和超高的工作负载，而且更重要的一点是，至强会更加稳定，更能应对一些严苛的工作环境。

除了性能强之外，W350 G50工作站的部署也相当灵活，它可以当做桌面上的塔式工作站用，也可以作为微型服务器组成企业的数据中心，相当于说买了它的企业万一以后有搭建机房的想法，那么就不用再去购置新的服务器了，可以把这些工作站利用起来搭建成自己的集群。

至于支持IPMI远程管理、冗余电源、企业级部件这些工作站该有的操作，W350 G50也都安排上了。

而从应用场景来看，在RTX™ 4000 Ada & RTX™ 5000 Ada的AI能力加持下，W350 G50其实非常适合中小企业用来搞AI大模型的开发和前期验证。

我们了解到，之前已经有AI个人工作者和工作室在使用高配置的PC或者Mac Studio来训练AI大模型，以及跑本地的技术验证，虽然效率低、跑得不是很快，但胜在成本低。

不过，这种模式并不是特别适合中小型企业，因为相比之下，企业对于效率和效益有着更高的追求，所以用W350 G50这类专业工作站来跑大模型会相对合适点。

而且工作站的适用面也更广，对于制造、影视、设计、动画以及建筑等行业用户来说，日常会用到很多专业软件，无论是3D建模、后期渲染，还是进行一些创意设计，这些活儿用工作站来干都会更加高效，并且现在很多专业软件当中已经内置了AI工具了，可以更好地提升效率。

就比如NVIDIA Canvas这个AI插件，它可以将简单的涂鸦生成一幅逼真的风景图，大大节省了建模或者拍摄的时间，而这也是搭载了RTX™ 4000 Ada & RTX™ 5000 Ada 的W350 G50工作站能够做到的众多功能之一。

不难看出，未来当AIGC产业发展到一定高度、解决了落地场景之后，算力资源将会成为各家争抢的重点，到时候比的就是谁家的AI可以更好更快地满足需求。

那么对于宁畅这样专注于算力服务的厂商来说，新发布的W350 G50工作站与业界领先的“全栈全液”智算中心建设能力，无疑为其开辟了未来无限可能的图景。当然，这笔“卖铲子”的生意也将会随着更多玩家的入局，迎来更加激烈的角逐。

探索AIGC桌面端算力的新趋势

热门阅读

推荐阅读