服务器模块化:创新之路还有多远?

发表时间: 2024-05-24 22:02

数据中心的快速发展过程中,模块化服务器设计已经成为提高效率和灵活性的关键。随着技术的进步,散热策略、性能优化和池化普及,正推动着这一领域的创新。睿启第一代服务器 Reech R720 代表了模块化设计的新思路,其即将发布的新一代产品更是备受期待。让我们一同见证这一技术革新如何塑造数据中心的未来。



模块化是基础架构的灵魂


“模块化”是服务器的基本理念,计算、存储、网络、电源、散热等部分都实现了模块化。


有了模块化的基本架构,厂商可以在工厂实现部分预制,并根据各种不同的场景快速调整配置,灵活地满足不同应用的需求,并提高现场交付速度。模块化还可以帮助定位故障、快速更换,有利于节省数据中心的运维成本。


业界在机架式服务器、整机柜的标准化、模块化方面已经进行了近20年的探索。如2008年英特尔推出的SSI(Server System Infrastructure),2011年的天蝎项目和Open Rack规范,到现在OCP已经为业界熟知,还有针对国内通用服务器市场的OCSP。大厂也有各自的一些探索供制造商参考,如腾讯的T-Flex、英伟达的MGX,诸如此类。



多年的推广与交流形成了比较稳定的解耦思路,其中部分组件(如电源、网卡)还实现了跨品牌的通用。但目前的模块化思路就是最优解吗?这种架构会一成不变吗?


答案当然是否定的!


IT行业唯一不变的就是快速变化!毕竟,在人类社会的过去百年当中,还有什么领域的发展速度可以与IT行业相提并论呢?


模块化的未来挑战


当前服务器在模块化方面面临的挑战有许多,我们可以举例几处:


散热需求更复杂。绝大多数的服务器散热依靠风冷,传统机架式服务器的散热模块就是风扇墙,不论其中置还是后置,或者组合,强制风冷的风道贯穿前后。但是,现在我们愈发依赖液冷来承载算力的进一步发展。而液冷又分为冷板式和浸没式。冷板式又在从风液混合向全液冷发展……在如此多样化的散热策略之下,散热模组的内涵扩大了,散热模组甚至超越了机箱,应当与机柜相提并论。


追求极致。机架式服务器可以通过调整各种不同侧重点的模块构建不同功能的节点:计算型、智算型、存储型……这种方案在未来一段时间依旧延续,且更注重在通用服务器的基础上,尽可能地挖掘特化的潜力。譬如多数2U机架服务器的前置硬盘仓可以支持24个2.5英寸盘位,但能不能挤下25个?答案是可以。再如,多数2U服务器可以装3块双宽GPU、4U服务器可以装8块,已经比较常见,但是,2U装4块、4U装10块,是不是可以进一步提升算力密度?而在突出这些不同的特长的同时,能否尽量避免重新设计、开模?


池化趋于普及。前面说的各种节点还是基于传统服务器基础发展而来,随着CXL的普及,池化的部署门槛降低,未来各池化的节点不再需要拥有全部的基本模块。现在就应该考虑近期投资的资产能否适应池化的基础架构需要。


轻装上阵,朝气蓬勃


2022年,英特尔、益企研究院共同发起的开放通用服务器(OCSP)社区,睿启服务器是OCSP的生态合作伙伴,期间我们有大量的交流。睿启第一代服务器Reech R720给我们留下了深刻的印象。在其第二代服务器上,我们看到了新的模块化思路,譬如对主板进行了进一步的解耦。最初我们对这样的设计是有一定疑惑的,主板还需要解耦吗?Ultra-low Loss PCB的成本能省多少?会不会“用力过度”了?但随着我们看到睿启服务器的浸没式液冷服务器设计的进一步细化,我们才更深刻理解了其通用机架服务器的主板在设计之初已经为浸没式液冷做准备了。


早期浸没式服务器只是把机架式服务器拆了再整机竖着摆,而睿启服务器的设计则充分体现了后发优势:更“原生”的架构可以明显减少模块体积,同时也就减少了相同算力对应的Tank的体积,减少工质的用量,降低系统总重。值得一提的是,这种新的模块化设计其实也是有可能用在未来的机架当中的。


通常的服务器发布会是围绕生态链上游新品(CPU、GPU)等召开的。但睿启服务器即将召开的新品发布会是基于对未来的理解。对这个服务器行业的后起之秀,我感受到的不仅仅是 “初生牛犊不怕虎”,而更是对未来的热切期待。


谁年轻的时候不是这样?一起改变世界!


欢迎大家与我们一起参加2024年5月30日召开的“2024年度睿启服务器新品发布会”,探秘新一代的模块化设计,包括能更好兼顾通用机架式服务器和浸没式液冷的主板,以及兼顾液冷和机架的模块化服务器等。希望这场发布会能够激发我们对未来服务器的共同思考。