激战服务器CPU:一场硬核对决

发表时间: 2022-12-05 18:20

随着云计算的蓬勃发展,各大IDC数据中心对服务器CPU的要求也是水涨船高。每逢有算力更强、性能更稳、成本更低的服务器CPU上市,都会引发众多数据中心用户的高度关注。究其原因其实非常简单:不论是一个百分点的性能提升,亦或是一个百分点的成本降低,数据中心里那么多台服务器日积月累下来,也会是一笔非常惊人的数字。

过去20年里,云服务器CPU市场一直被英特尔的x86架构统治,市场份额甚至一度超过90%。近几年中,AMD一直紧随后,穷追不舍,进攻英特尔市场。现在,服务器CPU领域风云再起。

服务器CPU发展历史

AMD和英特尔是PC制造领域最具标志性的两个名字。几十年来,他们一直在努力为游戏玩家、休闲网络浏览器和专业人士提供速度最快、功能最强大、功能最丰富的处理器。多年来,他们来来回回几次激烈竞争。AMD推出了突破性的设计,而英特尔则用自己的革命性芯片做出回应。英特尔在2005年至2015年期间对旗舰性能保持了强有力的把握,AMD真正扭转了局面推出其Ryzen处理器。

自英特尔在1978年推出第一颗x86处理器8086后,CPU的发展方向一直都是整合更多的指令集与外部控制器,以及更高的主频。单核性能的提升除了架构以外很重要的一点是取决于频率和缓存,而频率限于CPU温度和功耗不可能增长太快,缓存限于CPU面积和成本同样不能快速增长,这样频率和缓存只能依靠半导体工艺的进步来逐步提升。当CPU的单核效能与频率都到瓶颈之后,英特尔与AMD都开始向多核发展。

英特尔从单核到多核之路

2005年5月,英特尔推出史上第一个双核处理器Pentium D系列,采用90nm工艺核心,每核心拥有1MBL2缓存,均是800MHz的FSB,随后还推出了带超线程技术的Pentium Extreme Edition 840处理器,双核四线程,FSB也提升到了1066MHz,频率也更高。

之后,Pentium D处理器的继任者是非常经典的Core 2 Due处理器,而且他们还用当年炮制首款双核处理器的手法造出了首款四核处理器Core 2 Quad。

2013年英特尔推出的Corei7-980X是首款6核处理器,核心代号Gulftown,它基于Westmere架构,处理器每核心拥有256KB L2缓存,共享12MB L3缓存,主频是3.33GHz,最高睿频3.6GHz。

桌面市场的第一颗真八核处理器是英特尔在2014年推出的Corei7-5960X,属于22nm的Haswell-E架构,基础频率3GHz,最高睿频3.5GHz,拥有20MBL3缓存,属于HEDT的X99平台。

后来,Core i7-6950X成为首款桌面的十核处理器,生产工艺从22nm升级到14nm,核心数量从上代Core i7-5960X的8核增加到10核,晶体管数量也从26亿增加到32亿。

2017年,英特尔推出了第七代Core X系列处理器,包括Skylake-X与Kabylake-X两种不同架构的处理器,SkylakeX处理器多了12核、14核、16核、18核的产品,并且用Core i9取代Core i7成为英特尔消费级市场上最强处理器的代名词。

英特尔的Lakefield项目于2019年正式公开,2020年正式上市,这款产品的实验性质很重,它是首款采用英特尔Foveros 3D堆叠工艺的产品,也是首款采用混合架构的x86五核处理器。从此英特尔开启混合架构新时代。

AMD从双核到96核

AMD的双核处理器Athlon 64 X2诞生于2005年5月。但与英特尔的PentiumD不同,AMD的Athlon 64 X2是在同一块芯片内整合了两个K8核心,两个核心之间可透过System Request Queue实现数据互通,因此执行效率远高于竞争对手产品。

2007年K10架构的四核于11月11日发布,它确实是首款原生四核处理器,并且首次把L3缓存引入到消费级市场,但整体效能不如对手的Core 2 Quad。主流平台的八核处理器,是2017年Zen架构的第一代Ryzen7列处理器,它正式引发了英特尔与AMD在处理器市场的核心数量大战。

2018年发布的第二代锐龙Threadripper,最大核心数量已达到32核。到了锐龙Threadripper 3000,CPU被拆分成CCD计算核心和IOD输入输出核心,解决了每个核心之间访问内存和PCI-E时延迟不一的问题,于是2020年,64核的锐龙Threadriper3990X从此诞生。

最近,在AMD推出的新服务器CPU中,其核心已经提高至96核。总的来看,在高性能计算领域,以尽可能得使用多核心处理器,获取更高的性能。

服务器CPU比拼激烈

在2022年投资者大会上,英特尔首次披露了2022-2024年的全新英特尔至强产品路线图。至强Xeon是主要用于"中间范围"的企业服务器和工作站。在英特尔的服务器主板上,最多达八个Xeon处理器能够共用100MHz的总线而进行多路处理。

目前,英特尔最新款服务器CPU仍旧是2021年推出的第三代至强(Xeon)可扩展处理器(代号Ice Lake),其主要亮点包括:采用英特尔最新的10nm工艺,单个芯片最多包含40核。与上一代20核Cascade Lake相比,IPC性能提升20%;在主流数据中心工作负载上性能平均提升46%;74%的AI推理性能增加;与5年前的老系统相比,平均性能提升2.65倍。

来源:英特尔

从路线图上看,英特尔下一代面向服务器领域CPU代号名为Sapphire Rapids。Sapphire Rapids采用12/13代酷睿同款的Intel7制造工艺,改用新的Socket E LGA4677封装接口,首次引入chiplet小芯片封装,物理层面最多60个Golden Cove微架构核心但首批只开启56个核心,集成112MB三级缓存,热设计功耗350W。

其他方面,内存支持八通道DDR5-4800,扩展连接提供80条PCIe 5.0/4.0通道,可选集成最多64GB HBM2e内存,还会支持CXL 1.0高速互连总线。

事实上,英特尔希望这款新处理器能凭借对DDR5、PCIe Gen5和Compute Express Link等新技术的率先支持,在市场上全面压制住AMD的下一代Epyc芯片Genoa。

然而,Sapphire Rapids的面世之路并不顺遂。去年6月,英特尔表示将把芯片的量产从2021年第四季度推迟至2022年第一季度,并计划在第二季度增加出货量。后来,英特尔又表示推迟计划,将在今年年底。目前,英特尔最终确定发表时间为2023年1月。

对此,英特尔高级研究员Ronak Singhal之前做了解释,他表示对英特尔这样的公司来说,优先考虑的是下一代至强处理器的质量。

AMD和英特尔在服务器CPU上的比拼从未停止。此前就有分析指出,AMD将以高于同行的速度增长,继续从竞争对手英特尔手上夺取市场份额,包括个人计算和服务器市场,这一趋势将在今年和明年持续,预计至少会保持到2024年末。AMD之所以能保持上升趋势,很大程度得益于EPYC处理器在服务器市场的表现。

与英特尔第三代至强Ice Lake叫阵的是AMD Milan。Milan是7nm,具有64个内核和128个线程,可容纳高达4TB的内存容量,并提供128个PCIe通道。Milan在其更新的微架构中打破了罗马,支持小芯片连接,并导致更多的L3缓存和减少的延迟。相较上一代性能提升19%;峰值功率增加17%。

对于下一代服务器CPU的竞争方面,英特尔宣布了推迟发布时间,但AMD依旧选择了在今年11月交出了其Epyc处理器系列的第四个版本,发布了代号Genoa(热那亚)的第四代EPYC9004系列处理器,基于Zen4架构,最多96核心192线程,支持12通道DDR5内存、128条PCIe5.0。

根据路线图,AMD还准备了一个Zen4c版本,产品代号Bergamo(贝加莫),主打多核心与高密度计算,最多128核心256线程、12通道DDR5,使用和Genoa同样的SP5接口,互相兼容。第四代Epyc使用5nm制造(以及用于内存的小芯片6nm)将900亿个晶体管封装到处理器中。AMD CTO Mark Papermaster近日接受采访时透露,Bergamo将在明年上半年正式发布。

可以看到,英特尔的Sapphire Rapid与AMD 128核Bergamo的发布时间均在明年上半年,这其中火药味十足。

服务器CPU涌向Arm

对服务器领域的追逐从未停止的,不仅有X86架构,还有Arm阵营。2018年10月,Arm首次宣布推出面向云到边缘基础设施产品Neoverse及其初步路线图,并承诺平台效能30%的年增长率指标将持续到2022年及以后。2020年9月,Neoverse再度进阶,新增两个全新的平台—Neoverse V1平台以及第二代的N系列平台Neoverse N2。

ArmNeoverse平台路线图

Omdia的数据显示,二季度Arm已拿下全球7.1%的服务器CPU市场。去年,阿里旗下的平头哥发布自研云芯片倚天710,它基于Arm架构,官方称之为“全球性能领先的云原生处理芯片”,性能超过业界标杆20%,能效比提升50%以上。

日本RIKEN实验室的“Fugaku”使用的Arm架构CPU,采用定制的ArmV8架构,依托7纳米FinFET制程技术生产。浮点运算部分是与Arm合作开发的SVE指令扩展,使用512bit浮点运算单元,大幅强化运算能力。

最近,亚马逊旗下云计算部门AWS宣布推出全新基于Arm架构、自研的高性能计算服务器CPU芯片Graviton 3E。运算性能比上一代多出35%,可组成最多64组虚拟CPU,并具有128GB存储容量,最快将在2023年初开始布署应用。

AWS高级副总裁彼得·德桑提斯(PeterDeSantis)更表示,这款处理器在某些高性能计算能力上是现有Graviton芯片的两倍,和其他AWS技术结合时,新芯片的性能还能再提高20%,他更直言,和购买英特尔、英伟达、AMD芯片相比,Graviton3E可以提供性价比更好的算力。

服务器CPU的领域,开始了新一轮的较量。