中国存储网8月21日消息,Supermicro(美国超微公司) 宣布扩展其 NVIDIA Blackwell 系统产品组合,推出全新 4U DLC-2 液冷 NVIDIA HGX B200 系统,准备批量发货,并推出风冷 8U 前置 I/O 系统。
该公司的新系统专为要求最苛刻的大规模 AI 训练和云规模推理工作负载而量身定制,简化了风冷或液冷 AI 基础设施的部署、管理和维护,旨在支持即将推出的 NVIDIA HGX B300 平台,允许轻松进行前端 I/O 访问,简化布线,提高热效率和计算密度,并降低运营费用 (OPEX)。
Supermicro 首席执行官兼总裁 Charles Liang 表示:“Supermicro 支持 DLC-2 的 NVIDIA HGX B200 系统引领我们的产品组合实现更大的节能和更快的 AI 工厂部署上线时间。“我们的 Building Block 架构使我们能够完全按照客户的要求快速交付解决方案。Supermicro 广泛的产品组合现在可以为各种 AI 基础设施环境提供精确优化的 NVIDIA Blackwell 解决方案,无论是部署到风冷还是液冷设施中。
该公司的 DLC-2 代表了下一代直接液体冷却解决方案,旨在满足人工智能优化数据中心不断增长的需求。这种冷却架构为高密度计算环境提供了显着的运营和成本效益。
- 数据中心节能高达 40%
- 通过提供端到端数据中心规模的液体冷却解决方案,加快部署时间并缩短上线时间
- 在入口温度高达 45°C 的温水冷却下,耗水量减少多达 40%,减少了冷水机的必要性
- 通过液冷 CPU、GPU、DIMM、PCIe 交换机、VRM、电源等捕获高达 98% 的系统热量
- 在低至 50dB 的噪音水平下实现安静的数据中心运行
Supermicro 现在提供 1 个最广泛的 NVIDIA HGX B200 解决方案组合,包括 2 个新的前置 I/O 系统和 6 个后置 I/O 系统,允许客户选择最优化的 CPU、内存、网络、存储和冷却配置。新的 4U 和 8U 前置 I/O NVIDIA HGX B200 系统建立在经过验证的大规模 AI 训练和推理部署解决方案之上,解决了部署的主要痛点,包括网络、布线和散热。
机架 48U 与 4U B200 液冷系统
“先进的基础设施正在加速每个行业的人工智能工业革命,”NVIDIA Corp. GPU 产品管理副总裁 Kaustubh Sanghani 说。Supermicro 的全新前端 I/O B200 系统基于最新的 NVIDIA Blackwell 架构,使企业能够以前所未有的速度部署和扩展 AI,从而提供突破性的创新、效率和卓越运营。“
现代人工智能数据中心需要高可扩展性,这需要大量的节点到节点连接。该系统的 8 个高性能 400G NVIDIA ConnectX-7 NIC 和 2 个 NVIDIA Bluefield-3 DPU 被移至系统前部,以便从冷通道配置网络电缆、存储驱动器托架和管理。完全支持 NVIDIA Quantum-2 InfiniBand 和 Spectrum-X 以太网平台,以确保最高性能的计算结构。
除了系统架构改进外,Supermicro 还对组件进行了微调,以最大限度地提高 AI 数据中心工作负载的效率、性能和成本节约。升级后的内存扩展具有 32 个 DIMM 插槽,为系统内存配置提供了更大的灵活性,从而实现了大容量内存的实施。大系统内存通过消除 CPU-GPU 瓶颈、优化大型工作负载处理、提高虚拟化环境中的多作业效率以及加速数据预处理,补充了 NVIDIA HGX B200 的 HBM3e GPU 内存。
所有 Supermicro 4U 液冷系统和 8U 或 10U 风冷系统都针对 NVIDIA HGX B200 8-GPU 进行了优化,每个 GPU 通过第 5 代 NVLink 以 1.8TB/s 的速度连接,每个系统总共提供 1.4TB 的 HBM3e GPU 内存。与 Hopper 一代 GPU 相比,NVIDIA 的 Blackwell 平台可提供高达 15 倍的实时推理性能和 3 倍的 LLM 训练速度。新的前置 I/O 系统配备双路 CPU,支持高达 350W 的英特尔至强 6 6700 系列处理器,可为各种 AI 工作负载提供高性能和效率。
前后4U前置I/O液冷系统
新推出的 4U 前置 I/O 液冷系统具有前置可访问的 NIC、DPU、存储和管理组件。它采用双路 Intel Xeon 6700 系列处理器,P 核高达 350W 和 NVIDIA HGX B200 8-GPU 配置(每个 GPU 180GB HBM3e)。该系统支持 32 个 DIMM,容量高达 8TB,速度为 5,200MT/s,容量高达 4TB,DDR6,400MT/s DDR5 RDIMM,外加 8 个热插拔 E1。S NVMe 存储驱动器托架和 2 个 M.2 NVMe 启动驱动器。网络连接包括 8 个单端口 NVIDIA ConnectX-7 NIC 或 NVIDIA BlueField-3 SuperNIC 和两个双端口 NVIDIA BlueField-3 DPU。
该公司将这种液冷系统设计为人口稠密的人工智能工厂的构建块,这些工厂可以达到超过 1,000 个节点的集群规模,与风冷相比,数据中心可节省高达 40% 的电力。
8U前置I/O风冷系统
8U前置I/O风冷系统具有相同的前置架构和核心规格,同时为没有液冷基础设施的AI工厂提供简化的解决方案。它具有紧凑的 8U 外形(与 Supermicro 的 10U 系统相比),具有降低高度的 CPU 托架,同时保持完整的 6U 高度 GPU 托架,以最大限度地提高风冷性能。