AMD处理器除了在消费级市场大放异彩,更在企业级、云计算以及HPC市场凭借AMD EPYC(霄龙) 系列处理器攻城略池。而在介于传统PC和HPC之间的HEDT/专业工作站平台上,AMD也提供了线程撕裂者 PRO处理器,其与EPYC持平的CPU核心数量以及超强的I/O数据带宽和扩展性,带来了突破性的工作效率提升,使得其受到多个行业人群的高度关注。
然而在工作站领域,AMD算是刚刚回归没几年的玩家,此前的工作站行业整体生态都并没有围绕AMD做长期的适配和优化。因此虽然其性能表现突出,但专业用户也难免犯嘀咕,看起来“跑分“很美好的AMD工作站方案,实际使用其性能和稳定性是否真的可以替代其他“看起来更熟悉且成熟”的方案呢?
正好Dell近期推出了搭载最新一代AMD线程撕裂者PRO 5000WX系列处理器的Precision 7865工作站。作为知名整机厂商,能够选择跟进“新潮”的AMD方案,想必也是经过一系列严苛测试验证后的结果。接下来我们就一起来看这台AMD工作站的表现。
▲Precision 7865整机体积约33L,基本接近大尺寸的传统台式机。
按照Dell产品线等级3、5、7的划分可知,7865是一款定位高端的专业工作站产品,为工程师、建筑师、创作者和设计师打造,目标是最大限度地满足要求严苛的多应用工作负载,使用户能够更有效地处理密集、复杂的工作流。而在过去,Dell 7系工作站通常会提供两颗芯片组成的双路工作站方案,而7865则反常地采用了单路芯片方案,其背后的底气就来源于它搭载了号称“一颗顶两颗”的AMD线程撕裂者PRO 5000-WX系列处理器。
▲AMD线程撕裂者PRO 5995WX 64核处理器的芯片架构示意图,一颗I/O die位于中间,周围分布了8个CCD计算组,每组含8个CPU核心。Chiplet小芯片结构可以实现灵活的排列组合。
AMD线程撕裂者 PRO 5000 WX系列处理器拥有更多的核心、计算线程数,更强的扩展能力以及专业的安全技术,最多64颗核心/128条计算线程,而与其对位的英特尔至强W-3300系列处理器最多只能提供38核心/76线程的解决方案。其内部设计选择了时下流行的Chiplet 小芯片设计,由多组CCD计算组组成,每组包含8个CPU核心,不同CCD组之间的数据交换以及整个CPU的内外数据传输都通过中心的I/O Die实现。而其采用的“Zen 3”处理器架构,由台积电7nm工艺打造,在频率相同的情况下相比“Zen 2”架构性能提升高达19%。配合256MB超大三级缓存作为“高速公路”,既能实现单芯片64核的突破性设计,又可以兼顾核心协同工作和访问延迟问题。
▲与竞争对手产品相比,锐龙线程撕裂者 PRO 5000 WX在工作频率、核心、线程数量与扩展能力上都全面领先
全系标配相同规格的强大I/O Die,让线程撕裂者PRO处理器具备支持8通道DDR4 3200 ECC内存的能力,并且最高可使用2TB内存。I/O Die还提供了多达128条PCIe 4.0通道(120条可用),让用户能够连接各种显卡、加速卡、NVMe SSD、高速PCIe网卡等多个PCIe设备,而同级的英特尔至强W-3300系列工作站处理器最多只能提供64条PCIe 4.0通道。
由于使用了台积电经过升级的7nm工艺制造,因此这款处理器在频率、功耗方面表现都更为出色。如64核心/128线程设计的线程撕裂者 Pro 5995WX处理器最高加速频率可达4.5GHz,TDP热设计功耗为280W,而基于Zen 2架构的上一代线程撕裂者 Pro 3995WX处理器的最高加速频率只有4.2GHz,但TDP热设计功耗仍达280W。与英特尔至强W-3300系列处理器相比,线程撕裂者 PRO 5000 WX系列处理器在工作频率上的优势也非常明显,前者能达到的最高加速频率只有4.0GHz, 且同价位段产品提供的核心数量更少。
▲Memory Guard技术可防止用户数据泄露
▲AMD PRO系列处理器的特色:集成片上安全处理器。其具体功能包括专用的安全子系统、安全启动、硬件验证启动、SME安全存储加密、SEV-ES、SNP等功能。
作为专业产品,线程撕裂者 PRO 5000-WX系列处理器还拥有PRO安全技术、PRO可管理性、PRO业务可靠性三大特性,通过AMD Memory Guard、AMD安全芯片、AMD影堆栈等安全技术,以及远程更新和修复联网设备的能力让用户的电脑使用更安全,维护更方便。
目前AMD线程撕裂者 PRO 5000-WX系列处理器包含从12核心/24线程的线程撕裂者PRO 5945WX到64核心/128线程的线程撕裂者PRO 5995WX总共五款处理器。用户在购买Dell Precision 7865工作站时,可以根据需求从这五款处理器中任选一款。本次我们的测试机器配置定位中间,采用了为专业工作负载而生的“全能选手”:线程撕裂者PRO 5965WX。它拥有24核48线程,最高加速频率可达4.5GHz,适用于设计与制造行业、媒体与娱乐行业的3D建模、动画制作与灯光渲染测试,以及软件开发与分析。
▲Dell Precision 7865内部结构示意图
▲打开机箱盖,可以看到工作站内安装了硕大的6铜管直触式处理器散热器
▲这款工作站甚至设计了专门帮助内存散热的风扇
为了保证线程撕裂者PRO 5000 WX处理器的稳定运行,Dell Precision 7865采用了优秀的散热设计。如它使用了硕大的6铜管直触式处理器散热器,内置多个散热风扇。包括机箱背板帮助处理器、硬盘散热的两个风扇,主板中部安装的帮助内存散热的DDR风扇,机箱正面下方帮助显卡、NVMe SSD散热的大尺寸系统风扇,以及机箱顶部对外置存储器进行散热的风扇。通过多个风扇配置,优化的风道设计,可以让电脑内部产生的大量废热快速从背板排出。
▲AMD线程撕裂者PRO 5965WX处理器,24核心/48线程,最高4.5GHz
▲64GB DDR4 3200双通道内存,8个插槽占用了2个
▲美光3400 PCIe4.0 1TB SSD+RTX A4000 16G专业图形卡
而AMD线程撕裂者PRO 5000-WX系列处理器与配套WRX80主板的使用也令Dell Precision 7865拥有强大的扩展能力。它总共配置了8根DDR4内存插槽,用户在实际使用中最多可安装1TB DDR4 3200内存。此次测试中的机器内则配置了64GB DDR4 3200 ECC内存。主板还提供了两根PCIe 4.0 x16显卡插槽、两根PCIe 4.0 x8插槽,以及两个PCIe 4.0 SSD M.2 2230/2280 SSD接口,让用户可连接多块显卡/PCIe设备与高速存储设备,由于CPU总线预留了128路直连的PCIe4.0通道,所以只要主板支持到位,采用线程撕裂者PRO系列的产品基本不需要担心扩展性问题。本次我们测试的电脑里则配备了一块RTX A4000 16GB专业显卡,以及一块美光3400 PCIe4.0 1TB SSD。
▲整机正面与背面都提供了丰富的USB接口、一个SD读卡器,千兆与万兆网卡组合的双网卡配置。
同时它也提供了2个2.5/3.5英寸HDD/ODD SATA插槽,2个Flexbay可抽换外置存储器接口。其中Flexbay接口可以让用户方便地无须打开机箱就能从外面安装SATA硬盘或NVMe SSD,以提升整机的存储能力。此外Dell Precision 7865的机箱正面、背面提供了总计4个USB 3.2 Gen1接口,3个USB 3.2 Gen2 Type-C接口,用户还可根据需要增配串行端口、PS2端口,以及DVD光驱。
▲本次测试的Dell Precision 7865配备了两个用于安装SATA硬盘的FlexBay
网络方面,Dell Precision 7865则采用了双网卡设计,通过瑞昱千兆网卡与Marvell万兆网卡的组合,让电脑在工作网络中拥有高速传输数据的能力。为了保证以上处理器、显卡与各种扩展设备的稳定运行,Dell Precision 7865配备了符合80 PLUS白金标准的1350W电源,其配套电源线也采用16A接口设计,需使用16A插座或16A转10A转接头才能正常使用,这是用户在使用前需要注意的。作为工作站设备并不会频繁地进行整机更换,性能不足需要升级时更多的是对部件进行替换或加装。1350W的大功率电源预留了更多的冗余,即使面对未来高端的大功率单路甚至多路显卡都无需担心供电不足。
▲Dell Precision 7865顶部设计了提手,让用户能方便地搬动这台沉重的电脑
总体来看,与一般个人PC设备不同,基于线程撕裂者 PRO 5000 WX系列处理器的Dell Precision 7865拥有强大的基础配置,优秀的散热设计,不错的扩展能力。像我们此次测试的这款机器的核心配置应该算只采用了中等配置,但凭借众多接口、扩展插槽,以及高功率电源的支持,也能让用户在后期轻松升级这台电脑的SSD存储容量、内存、显示设备甚至处理器。
接下来就让我们来看看这款配置不算特别高的Dell Precision 7865能有怎样的表现,是否能满足用户需求。
测试平台
机型:Dell Precision 7865工作站
处理器:线程撕裂者PRO 5965WX(24核)
显卡:RTX A4000 16GB专业显卡
主板:AMD WRX80 Premium主板
内存:64GB DDR4 3200双通道
SSD:美光3400 PCIe4.0 1TB SSD
▲在CINEBENCH R23处理器多核心渲染性能测试中,线程撕裂者 PRO 5965WX可以轻松超越“上上一代”的32核、64线程锐龙线程撕裂者 2990WX处理器
▲在PerformanceTest 10.2处理器性能测试中,其CPU性能击败了世界上99%的其他处理器
从处理器基准测试来看,尽管线程撕裂者PRO 5965WX并不是同系列中定位最高的CPU,但凭借新一代7nm工艺和“Zen 3”架构,以及高达4.5GHz的最大加速频率,这款处理器的性能表现依然非常抢眼。从CINEBENCH R23处理器多核心渲染性能测试来看,它的分数突破40000分大关,远超采用初代“Zen+”架构的32核AMD锐龙线程撕裂者2990WX处理器。尽管核心和线程数更多,但后者的得分只有它的73.7%。而从PerformanceTest 10.2处理器性能测试来看,其CPU性能总分高达66188分,击败了世界上99%的其他处理器。
▲在SHA3哈希算法性能测试、单精度浮点性能、双精度浮点性能测试中,24核的线程撕裂者PRO 5965WX甚至超过了上代的32核锐龙线程撕裂者3970X
鉴于工作站还有科学计算的应用需求,因此我们还使用AIDA64的处理器性能测试工具对Dell Precision 7865进行了考察。结果也是让人非常满意的。同样借助AMD线程撕裂者PRO 5965WX更新的处理器架构、更高的工作频率,它在处理器SHA3哈希算法性能测试、处理器单精度浮点性能、处理器双精度浮点性能测试中,相比核心数量更多的上代锐龙线程撕裂者3970X 32核方案都有较大的优势。而在其他测试中,线程撕裂者 PRO 5965WX的表现与其上一代32核心处理器差距也不大,更是远远优于其他核心数更少的产品,非常适合用于科学计算。
新一代24核处理器有机会超越上代32核处理器,这也说明要提升CPU的计算性能,增加核心数量是一方面,更重要的是新的CPU架构带来的单位频率性能(IPC)的提升以及更高的基频和加速频率。
从以上测试截图看到另一个有趣的结果是,物理核心数量更多的16核12900K处理器反而在一些专业运算上的表现不如12核的锐龙9 5900X,相比物理核心数量差距不大的24核线程撕裂者PRO 5965WX处理器更是差了2倍以上!这也侧面反映了至少目前实际的操作系统和应用程序生态上,还是需要更多的标准x86性能核心,这也说明全大核的CPU方案更能胜任专业应用。
▲UL Procyon图片编辑与视频编辑测试成绩细节,如图所示,Dell Precision 7865在一些任务中的耗时很低,在视频编辑导出H.265(4K UHD)2/2项目中的耗时只有52.991s,普通商用电脑耗时需300s以上
接下来,我们还使用多种专业软件对Dell Precision 7865在各个应用中的表现进行了详细测试。首先在使用真实软件对整机应用性能进行测试的UL Procyon测试中,它就有不错的表现。如在基于Photoshop、Lightroom Classic进行的图片编辑测试中,它是通过各种图片编辑任务,每项任务耗时,综合计算出的得分,任务耗时越低,得分就越高。而这款工作站的得分高达8166分,相比常见的高性能PC处理器 6000多分的成绩大幅度领先。
在比较依赖处理器多核心性能与显卡性能的Premiere Pro视频编辑测试中,其领先优势就更大,成绩达到7787分,而普通处理器、显卡平台一般不到3000分,原因就是Precision 7865可以有效地缩短任务执行时间,如在最后一个测试项目,导出H.265 4K视频时,Dell Precision 7865的耗时只有不到53s,而普通电脑的耗时则需要300s以上。
▲使用支持CPU与GPU一起进行渲染的引擎,可以大幅提升渲染速度。
在渲染性能测试中,借助高性能专业显卡,Dell Precision 7865在Blender Benchmark测试中也有不错的表现,Monster、junkshop、classroom三个场景的渲染速度分别达到1558.7、986.6、871.4。普通PC整机在该测试中的成绩一般在700、400、400分左右。值得一提的是,如果用户使用的渲染引擎支持处理器与GPU同时进行渲染,一起来完成一个渲染任务,那么24核的线程撕裂者PRO 5965WX处理器也能发挥不小的作用。如在单纯依靠GPU的V-Ray GPU渲染性能测试中,其渲染性能为1291vpaths,而如果将CPU加入进来,一起进行渲染,其渲染性能则可达到2031vpaths,整机渲染性能提升幅度高达57.3%。
▲从SPEC官方发布的SPECworkstation 3.1 2K分辨率测试成绩来看,除了64核心处理器与双路系统外,Dell Precision 7865在绝大部分测试中都战胜了其他平台。
而在以大量应用软件与科学计算软件为基础,专门对工作站在各个应用领域进行测试的SPECworkstation 3.1测试中,Dell Precision 7865也有很不错的表现。该测试包含7-zip、Handbrake、Blender、ShowCase、FFTW傅里叶变换计算、LUXRENDER渲染等多达30个软件与科学计算测试。测试会根据软件与科学计算的应用领域进行分类,每一领域得分则由该领域各项测试的任务执行速度、磁盘传输速度、模型显示帧数综合计算而来,考验整机的综合配置。而Dell Precision 7865在媒体与娱乐行业(M+E)、产品开发(Prod Dev)、生命科学(Life Sci)、金融服务(Finance)、能源应用(Energy)领域测试中都获得了不错的得分,分别为5.39、4.6、4.79、9.56、6.28分。从上面SPEC的公开成绩来看,除了不敌64核心处理器与其他品牌的双芯片方案外,它在绝大部分测试中都战胜了其他单路平台,而且优势还不小,非常适合企业用来替换性能较差的工作站。
▲在近4K的3800×2120分辨率下,Dell Precision 7865也能在SolidWorks 2020、Maya 2019等专业设计软件中提供极高的运行帧数。
考虑到专业用户会使用不同种类的设计、工程软件进行工作,所以我们还特别采用SPECviewperf 2020测试了工作站在不同设计软件中的图形性能表现。结果依然很不错,它在众多测试中都获得了较高的得分,该测试的得分主要根据不同渲染模式下的模型在各类设计软件的显示帧数综合计算而来。
从测试细节来看,在近4K分辨率、3800×2120下,这款工作站在3dsMax、CATIA、Creo、UG NX、SolidWorks等专业软件中显示各类渲染模式下的模型帧数都能轻松达到30fps以上,很多模型的显示帧数甚至能达到100fps以上,意味着用户可以通过Dell Precision 7865在高分辨率下非常流畅地进行各类专业设计与应用。当然在1080p分辨率下,Dell Precision 7865运行这些设计软件更是毫无压力。我们手上的产品采用了定位较高的RTX A4000专业卡,得益于线程撕裂者PRO提供了128路PCIe4.0通道供给扩展,Precision 7865也支持更高阶的显卡选配和扩展需求。
▲在AIDA 64 FPU烤机半小时后,线程撕裂者 PRO 5965WX的24颗核心全部运行在4.1GHz以上,温度也控制在80℃以内。
对于专业用户而言,除了性能,更为重要的是整机稳定性,毕竟如果因整机工作不稳定而出现死机、闪退等现象,导致数据未保存或无法长时间的稳定工作,那才会造成更大的损失。因此我们还特别通过AIDA 64 FPU烤机测试进行了验证,结果显示Dell Precision 7865的内部散热设计显然很有效,在烤机半小时后,系统不仅运行稳定,没有出现任何错误,而且线程撕裂者PRO 5965WX处理器的全核心满载运行频率还比较高,24颗核心都运行在4.1GHz以上,处理器工作温度只是在79℃左右。用户可以完全放心地将长时间渲染或科学计算这类任务交给Dell Precision 7865工作站。
最后再谈谈噪音,本次我们还特别使用TDJ824精密数字声级计测试了工作站的噪音表现。总体来看,其噪音不大,在满载工作时,距离机箱正面15cm的噪音也就在50dB左右,所以对于使用者而言,日常使用的噪音远低于这个数值,并不会造成明显干扰。何况用户对于塔式工作站这类工具属性明显的设备,只要在可接受范围内,对噪音重视的优先级要远低于运算效率。
从以上测试来看,AMD的工作站方案带给我们很多惊喜。依托AMD整体的先进纳米制程战略,可以在维持功耗水平前提下提供更高频率和更多核心数量的CPU方案。而与服务器和数据中心CPU同源的架构方案让线程撕裂者PRO处理器在CPU多核协同效率、I/O数据传输、总线扩展等方面的表现相对其他工作站处理器都更具竞争力。
基于AMD线程撕裂者PRO处理器的工作站方案让人们看到,顶级工作站并不一定需要采用成本高昂、功耗夸张的多CPU组合方案,强大的单芯片工作站方案在采购成本、运维成本、稳定性以及节能减碳等方面的表现极其出色。而随着全新5nm “Zen 4”架构的新一代EPYC服务器CPU面世,相信我们未来也有机会看到单芯片工作站上出现96核128线程的“灭霸”级产品,AMD将成为改变专业工作站“牌局”的重要玩家。
而Dell出色的散热和结构设计以及强大扩展性则使得AMD线程撕裂者PRO处理器在Precision 7865工作站上可以充分发挥其计算性能和扩展性能。其强大的综合性能表现,充足的扩展能力、较低的工作温度与噪音令其在各方面的表现都趋于完美,对于专业用户而言,它就是大幅提升生产力的利器。目前Precision7865 已经在Dell官网以及电商平台开售,提供丰富灵活的CPU、内存、硬盘、显卡、I/O选项。作为面向商用大客户的产品,由于不同客户会提出个性化配置,其具体售价还要取决于企业的需求变化。