FP5468G2异构计算服务器:引领异构计算黄金时代的变革力量

发表时间: 2020-02-11 18:31

就在几年前,计算领域还是通用计算的天下。此一时,彼一时,随着计算密集型领域的快速崛起,面对移动互联网、大数据和云计算需求的爆炸式增长,传统的单一CPU方案越来越力不从心。

另一方面,半导体技术在纵向提速上也已经达到了物理极限,处理器性能再也无法按照摩尔定律,以每18个月翻倍的速度持续增长。

异构计算崛起,

2020年市场规模将达25.75亿美元

在这样的背景下,异构计算“异军突起”,成为支撑先进和更复杂的AI、AIoT等对计算量要求巨大应用的有力武器,在产业中迅速“上位”,使得异构计算和异构计算服务器市场迎来发展的黄金时期。

据 IDC数据显示,2019 年上半年,中国异构计算服务器市场中,GPU 加速器市场规模已达 9.37 亿美元,FPFA/ASIC/其他加速器市场发展较之稍缓,规模达到 1250 万美元。但这些数字背后,隐藏着中国异构计算服务器市场的巨大潜力。

据 IDC预测,2020 年,中国的 GPU 加速器市场将以 38.9% 的速度增长至25.75 亿美元,2023 年将增长至 44.47 亿美元,相比 2019 年增长近 5 倍。而在中国,GPU 服务器也已广泛应用于各行各业,包括互联网、服务业、政务、教育、电信、制造业、金融业,等等。

这些数字,彰显着中国异构计算服务市场的黄金时期已然开启。

浪潮商用机器FP5468G2,

异构计算的弄潮儿

“时势造英雄”,识时务者为俊杰,各大云计算和服务厂商相继意识到异构计算是大势所趋后,纷纷推出自己的异构计算产品和服务,其中就包括以自主研发技术实力专注于高端服务器的浪潮商用机器。

其实早在 2018 年 7 月,浪潮商用机器已经推出了面向大规模数据中心的大数据分析应用设计的高端双路主流机架式服务器FP5280G2,以性能、存储及拓展等多方面的卓越表现,助力企业应对数据海洋中多种IT应用带来的挑战。

但超算和AI的融合应用趋势对计算性能提出了更高的要求,浪潮商用机器顺应这一市场需求,于 2019 年 12 月推出了拥有全场景超强异构计算能力,能够支持AI云平台建设、深度学习训练和推理等应用的FP5468G2。这款8/16 卡的服务器可以灵活调配,为HPC与AI的融合应用需求提供了更好的选择,能够帮助各行各业在异构计算领域作出创新。

而在这波浪潮中,嗅到商机的并非浪潮商用机器一家,其他厂商也推出过自己的异构计算服务器产品。相比之下,FP5468G2 在 CPU、硬盘等方面优势明显。

把一台 FP5468G2 服务器拆开,我们可以清晰地看到其独特的布局设计,包括最高可支持24块3.5英寸大容量硬盘的前置存储,其中6个硬盘槽位可支持U.2 NVMe SSD,提供高效的数据读取和落盘速度,极致的高效大容量本地存储和高速IO拓展性能,为企业级用户提供了海量数据存储的优选平台;此外整机还支持2+2 冗余铂金电源,后置支持4个标准PCIe x16插槽,可支持4个100Gb远程直接内存访问(RDMA)高速网络。

待深入了解 FP5468G2 的内部架构之后,则会发现全新的架构,尤其其支持balance、common、cascade三种拓扑的灵活的异构拓扑配置,让它成为一个计算力超群的“小涡轮”,以合理的设计和完善的配置支持着复杂、大量的计算,并且能够根据应用场景/训练模型,灵活进行拓扑切换。

FP5468G2 支持2颗POWER9 Sforza CPU,最多可支持 44 核及176线程超强调度能力,再加上8块V100或者16块T4 GPU,针对特定深度学习模型调优,性能相较同等X86平台可提升多达20%,并全面兼容FPGA/AISC,提供特定应用加速。

赋能AI、云计算三大应用场景,

成本、性能优势尽显

智能视频分析:成本更低

抛开技术和其他相关因素的考量,成本一直是阻碍企业采用异构计算服务器的重要因素之一。而与同类型产品相比,FP5468G2在成本上有着明显的优势,尤其是在其三大应用场景之一——智能视频分析领域。

FP5468G2可用于安防智能视频分析,包括平安城市、智能交通、智慧社区、车辆识别、舆情分析等。在这些场景中,用户最大的问题是获得最优性价比存储空间,节省TCO。

相比之下,FP5468G2在智能视频分析领域的成本优势主要体现在以下三方面:

1. 节省空间:平均单位GPU占用0.25U机柜空间,部署密度更高;

2. 降低采购成本:假设客户需要16颗T4 GPU算力,一台FP5468G2相比于4台FP5280G2成本节省约24万;

3. 降低运营成本:节约电力成本;假设工业用电计1元/kW·h,16卡GPU算力要求下,单台FP5468G2三年可节省电费3.15万元。

DL训练:超强算力、灵活拓扑

随着AI技术的进步,很多企业都选择推出自己的AI产品和技术,随之而来的是大量深度学习训练的需求。然而,深度学习训练需要超强的算力支持,极高的存储IO,以及强大的数据交换能力,然而虽然市面上的产品和方案琳琅满目,但真正能同时具备这些能力的产品实际上是凤毛麟角。

FP5468G2在深度学习训练场景中则兼顾了这几点,赋能AI企业,进行图像检测、语音识别和自然语言处理等,使教育行业能够更加高效地推进科学研究、高性能计算、人工智能算法研究等。

具体说来,FP5468G2在深度学习训练场景中的优势体现在以下具体的数字之中:

  • 超强算力

支持8 块V100或16 块T4 GPU卡,提供全场景超强异构计算能力

    • 2颗POWER9处理器,具有多达44个核心、176线程超强调度能力;
    • 支持4个标准 PCIe x16 插槽,支持4个100Gb高速网络
  • 灵活拓扑
    • 支持balance、common、cascade三种拓扑,可根据应用场景/训练模型,进行灵活拓扑切换;
  • 合理设计、适配完善
    • GPU/CPU分离散热,保障机器高效稳定运行;
    • 全面兼容FPGA/AISC, 提供特定应用加速。

值得一提的是,POWER9 采用增强的架构体系,可支持SMT4 并发多线程110MB 片上L3 缓存,能更好应对GPU数量增加带来的数据调度负载的提升;独特的高宽带设计使得片内宽带可达 7TB/s,外联宽带达 25 GB/s。全新的微架构对称数据处理引擎设计,更高效的指令流水线与单线程性能,海量的数据存储能力,让FP5468G2的实力不容小觑。

AI云/DL推理:海量存储空间

FP5468G2的第三个应用场景是AI云/深度学习推理,在互联网行业,其可用于客户行为分析、互动娱乐、舆情分析、精准营销、内容监控等;在金融行业,可用于智能客服、人脸识别、风险评估、智能投顾等;在电信行业,可用于智能服务、智能网络、智能客服等。

在这些场景中,动辄数亿TB的数据流量往往需要海量的存储空间,以应对每天的日常运营。

FP5468G2支持海量的数据存储和高速IO扩展:

  • 最大支持24块3.5英寸大容量硬盘,其中可支持6块U.2 NVMe SSD
  • 支持4个标准 PCIe x16 插槽,支持4个100Gb高速网络

FP5468G2可用于AI 公有云、企业 AI 云、混合型 AI 计算应用,如数据源中心管理、智慧医疗一卡通、政务服务云、高性能计算等。

人工智能领域,FP5468G2 可用于深度学习训练和推理,是模型调优的一把好手。

在视频智能分析领域,FP5468G2 可在平安城市、智能交通、智慧社区的安防方面发挥巨大的作用,满足视频流海量存储需求,进行信息实时检索、音视频转码/压缩等。

展望未来,像 FP5468G2 这样的异构服务器发展前景非常可观。据 IDC 数据显示,2020 年之前,异构计算的应用场景和服务领域已经十分广泛,包括发展相对成熟的智能客服、语音识别、人脸识别、风险评估等领域。但在 2020 年之后,异构计算将拓展到智能机器人、智能服务、智能工厂、IT 自动化、智能导诊,甚至语言能力等更加复杂的场景中;到 2025 年,异构计算在自适应学习、智能诊断等需要谨慎决策的场景中也将发挥更大的作用。