/ 中国存储网

下一代 HPE Cray 超级计算产品组合引入计算密度以提高 AI 生产力

2025-11-14 22:28:58 来源:中国存储网

中国存储网消息,近日惠与宣布推出下一代 HPE Cray 超级计算产品组合的最新成员,提供行业领先的计算密度 ,旨在满足 AI 需求,同时实现大规模性能。

下一代 HPE Cray 超级计算产品组合引入计算密度以提高 AI 生产力

  • HPE 为其下一代超级计算平台推出三个多合作伙伴、多工作负载计算刀片,实现业界最高的计算性能密度之一
  • HPE 超级计算管理软件在系统生命周期的所有阶段为 AI 和 HPC 基础设施提供安全的系统管理体验
  • 斯图加特大学和莱布尼茨超级计算中心选择新的 HPE Cray 超级计算 GX5000 平台,验证了新解决方案的行业领先创新

HPE Cray 超级计算产品组合扩展包括三个多合作伙伴、多工作负载计算刀片、统一管理软件和高性能互连支持,为越来越多地转向人工智能来推进模拟和推动科学发现的研究实验室、主权实体和大型企业建立了业内最强大的超级计算架构之一。

此次产品组合扩展是继上个月首次亮相的 HPE Cray 超级计算 GX5000 之后,该产品专为在融合 AI 和 HPC 时代实现超级计算突破而打造。该平台由新的 HPE Cray 超级计算存储系统 K3000 增强,这是业界第一个工厂构建的存储系统,具有嵌入式分布式异步对象存储 (DAOS) 开源软件,可提高性能 2

下一代 HPE Cray 平台在行业迅速采用

斯图加特大学 (HLRS) 的高性能计算中心和巴伐利亚科学与人文科学院的莱布尼茨超级计算中心 (LRZ) 已选择 HPE Cray 超级计算 GX5000 作为其下一代超级计算机的平台。这种下一代超级计算产品组合已经在一些世界上性能最高的超级计算机中获得了关注,包括即将推出的 HLRS 的 Herder 超级计算机和 LRZ 的 Blue Lion 超级计算机,使每个客户都能开启新的科学视野。

LRZ董事会主席Dieter Kranzlmüller教授博士表示:“在LRZ,我们的使命是提供世界一流的高性能计算,推动具有全球影响力的研究,同时确保我们的超级计算机高效、可持续地运行“即将推出的 HPE Cray GX500 平台被选用于我们的下一个旗舰系统 Blue Lion,完美地体现了这一承诺。该系统采用 100% 直接液体冷却,可在高达 40°C 的温度下运行,可在整个加兴研究园区重复利用废热。Blue Lion 的持续性能比我们当前的系统快 30 倍,将使研究人员能够将传统建模和模拟工作流程与尖端的人工智能方法无缝集成,从而以前所未有的方式突破科学发现的界限。

新型直接液冷多伙伴、多工作负载处理刀片

这三款新刀片由 100% 直接液体冷却提供支持,使客户能够为下一代 Nvidia Rubin 平台和 AMD Instinct MI430X 等旗舰 GPU 或代号为“Venice”的下一代 AMD EPYC 处理器等旗舰 CPU 部署行业领先的性能密度。所有处理刀片都具有每个刀片四个或八个 HPE Slingshot 400 Gbps 端点可供选择,每个刀片可选择两个非易失性内存快速 (NVMe) 固态硬盘 (SSD)。三个处理刀片的混合可以部署在 HPE Cray 超级计算 GX5000 计算机架中,使客户能够为其工作负载配置最佳刀片组合,即使是在小型配置中也是如此。

  • HPE Cray 超级计算 GX440n 加速刀片 – 该刀片提供用于混合精度计算的通用计算引擎,具有四个 Nvidia Vera CPU 和八个 Nvidia Rubin GPU。每个计算机架最多可配置 24 个刀片,提供行业领先的 Nvidia Rubin GPU 密度,每个机架最多可配置 192 个 Nvidia Rubin GPU。

  • HPE Cray 超级计算 GX350a 加速刀片 – 此刀片推荐给需要通用计算引擎以实现 AMD CPU 和 GPU 混合精度计算的客户。该刀片包括一个下一代 AMD EPYC、“Venice”、CPU 和四个 AMD Instinct MI430X GPU,这是专为主权 AI 和 HPC 设计的新型 MI400 系列加速器。每个计算机架最多可配置 28 个刀片,每个机架最多可提供 112 个 AMD MI430X GPU。

  • HPE Cray 超级计算 GX250 计算刀片 – 专为下一代超级计算机设计,推荐给希望使用八个下一代 AMD EPYC(“威尼斯”CPU)为双精度工作负载构建纯 CPU 分区的客户。在这种情况下,下一代超级计算机的 GPU 分区可以构建在前面列出的任何一个加速刀片上——具体取决于客户的偏好。每个计算机架最多可配置 40 个刀片,提供行业领先的旗舰 x86 CPU 核心密度。

统一、多租户和安全的系统管理体验

HPE 超级计算管理软件引入了支持多租户、虚拟化和容器化环境的新功能,为客户提供部署融合 AI 和 HPC 处理的更大灵活性,并在必要时隔离工作负载和用户组。新软件还提供对系统范围的电力和能源的管理。此功能允许客户监控功耗、帮助估算消耗并与功耗感知调度程序集成,使客户能够最大限度地提高能源效率并预测成本。

该软件在超级计算机生命周期的各个阶段(包括配置、监控、电源和冷却以及扩展)为 AI 和 HPC 基础设施提供统一且安全的系统管理体验。新功能具有增强的安全功能和改进的治理报告。

HPE Slingshot 400 现在可用于基于 GX5000 的系统

HPE Slingshot 5000 现已适用于 HPE Cray Supercomputing GX400 平台,专为更密集的外形而设计,旨在在新的融合 AI 和 HPC 平台支持的更繁重的工作负载下大规模执行。

为 100% 直接液冷交换机刀片开发了新机箱,具有 64 个 400Gb/s 端口,并部署在以下配置中:

  • 8 台交换机,512 个端口
  • 16 个交换机,1,024 个端口
  • 32 台交换机,2,048 个端口

HPE Slingshot 400 交换机于去年首次发布,利用 HPE Cray 超级计算 GX5000 更高性能拓扑中部署的所有可用带宽,为客户提供减少延迟、提高持续带宽和可靠性,同时管理成本。

HPE Cray 超级计算存储系统 K3000、DAOS 存储服务器

下一代 HPE Cray 超级计算产品组合引入计算密度以提高 AI 生产力

基于 DAOS 的存储解决方案提高了 AI 应用程序的生产力 

HPE Cray 超级计算存储系统 K3000 基于 HPE ProLiant 计算 DL360 Gen12 服务器。该存储系统提供行业领先的计算性能、具有可扩展性的内存密度和高速数据传输速率,以运行要求苛刻的应用程序。这些功能与 DAOS 的低延迟架构相结合,将使超级计算客户能够以更高的生产力运行输入/输出绑定的 AI 应用程序。

根据项目要求,基于 HPE ProLiant 计算服务器的 DAOS 存储服务器将提供多种驱动器尺寸和配置,包括:

  • 性能优化的 DAOS 存储服务器,具有 8 个、12 个或 16 个 NVMe 驱动器
  • 容量优化的 DAOS 存储服务器,具有 20 个 NVMe 驱动器
  • 驱动器大小为 3.84TB、7.68TB 或 15.36TB
  • 512GB、1,024GB 或 2,048GB DRAM 配置,具体取决于所选驱动器大小

连接选项包括 HPE Slingshot 200、Slingshot 400、InfiniBand NDR 或每秒 400 Gb 以太网。

专为超级计算设计的服务体验 

从应用性能优化到全球交钥匙实施和 24×7 全天候运营支持,慧与超级计算服务可帮助客户获得并保持其投资的全部价值。

作为超级计算 3 领域的全球领导者,慧与利用数十年的专业知识来提供先进且节能的 AI 和 HPC 解决方案。通过提供无与伦比的性能和可扩展性,该公司为客户提供实现其最雄心勃勃的目标和推动创新所需的资源。

可用性

  • HPE Cray 超级计算 GX440n 加速刀片、HPE Cray 超级计算 GX250 计算刀片和 HPE Cray 超级计算 GX350a 加速刀片将于 2027 年初上市
  • HPE 超级计算管理软件将于 2027 年初上市
  • HPE Slingshot 400 将于 5000 年初用于基于 HPE Cray 超级计算 GX2027 系统的集群
  • 配备 HPE ProLiant 计算服务器的 HPE Cray 超级计算存储系统 K3000 将于 2026 年初上市

评论

“最新的 HPE Cray 超级计算平台反映了 AMD 和 HPE 之间的深度合作,以开发 HPC 和 AI 融合的领先技术,”AMD HPC 和 Sovereign AI 企业副总裁 Travis Karr 说。“通过将由 AMD EPYC CPU 和 AMD Instinct GPU 提供支持的高密度计算刀片结合在一起,我们正在通过可扩展、节能的解决方案帮助客户应对世界上一些最复杂的科学和人工智能挑战。”

“HPE 采用 Nvidia Vera Rubin 的下一代 AI 超级计算机旨在增强科学发现,”Nvidia HPC、云和 AI 基础设施高级总监 Dion Harris 说。“这些 HPE GX5000 系统由 Nvidia 提供支持,将促进模拟、分析和人工智能,为加速人工智能工业革命提供必要的基础设施。”

“高性能计算和人工智能已成为增长非常高的领域,”Hyperion Research 首席执行官 Earl Joseph 博士说。“HPE 的下一代 GX5000 超级计算机将帮助研究人员和公司显着开发更好的产品和新的科学发现,并通过实现关键的社会目标来帮助改变社会。”