/ 中国存储网

HPE 将为橡树岭国家实验室构建两个下一代百亿亿次级超级计算机“Discovery”和 AI 集群“Lux”

2025-11-14 22:41:27 来源:中国存储网

中国存储网消息,HPE 宣布被选中为美国能源部 (DOE) 橡树岭国家实验室 (ORNL) 构建两个系统,作为美国能源部推进美国在支持科学、能源和国家安全的人工智能 (AI) 和超级计算方面的领导地位的使命的一部分。新系统包括第二代百亿亿次级 HPC“Discovery”,它是 ORNL 的 Frontier(一个 HPE 构建的系统,打破了百亿亿次级速度障碍)的继任者,以及一个新的 AI 集群“Lux”,它将支持美国能源部通过多租户类云平台推进 AI 和 ML 的举措。

  • 慧与构建的 Discovery 将把生产力提高 10 倍,并开启精准医学、癌症研究、核能和航空航天领域的新科学视野
  • 由 HPE 构建的 Lux 系统将提供一个灵活的多租户 AI 云平台来支持训练和推理
  • Discovery 将推出全新的 HPE Cray 超级计算 GX5000,这是专为融合 AI 和 HPC 时代打造的下一代 HPC,旨在为实验室基于物理的建模、模拟和数据驱动的 AI 模型提高性能和生产力,并为量子计算提供测试平台功能
  • 新的 HPE Cray 超级计算存储系统 K3000 是 HPE Cray 超级计算 GX5000 的一个选项,是业界第一个带有嵌入式分布式异步对象存储 (DAOS) 开源软件的工厂制造的存储系统

 

HPE 将为橡树岭国家实验室构建两个下一代百亿亿次级超级计算机“Discovery”和 AI 集群“Lux”

Discovery 将基于新的 HPE Cray 超级计算 GX5000,这是 HPE 的下一代超级计算平台,用于领导级系统,利用统一的 AI 和高性能计算 (HPC) 架构来简化站点范围和跨分布式集群的运营。它将通过新的基于 DAOS 的 HPE Cray 超级计算存储系统 K3000 进行增强,这是 HPE Cray 超级计算 GX5000 的存储选项。Discovery 将为人工智能、高性能计算和量子计算提供新功能,预计将将精选应用程序的生产力提高十倍1,使科学家能够加速精准医学、癌症研究、核能和航空航天等领域的突破。

我们很自豪能够以这种领导创新和与美国能源部、ORNL 和 AMD 的强大公私合作伙伴关系为基础,打造 Discovery 和 Lux,加速科学发现和人工智能创新的下一个时代,“HPE 总裁兼首席执行官 Antonio Neri 说。“当我们为橡树岭国家实验室建造 Frontier 并迎来百亿亿次级时,我们实现了超级计算历史的顶峰,并为美国取得了胜利。我们很自豪能够以这种领导创新和与美国能源部、ORNL 和 AMD 的强大公私合作伙伴关系为基础,打造 Discovery 和 Lux,加速科学发现和人工智能创新的下一个时代。

Lux 将是一个基于直接液冷 HPE ProLiant Compute XD685 的专用 AI 系统,并具有 AMD Instinct MI355X GPU、AMD EPYC CPU 和 AMD Pensando 网络。Lux 旨在加强对人工智能资源的访问,将为美国各地的研究人员提供对专门用于训练和推理资源的主权人工智能工厂的类似云的访问。

Discovery 将提升最初为 ORNL 的 HPE 构建的 Frontier HPC 开发的百亿亿次级计算能力。因此,Discovery 将在各个科学领域开辟新的科学视野,同时推进实验室的创新和安全使命。

我们预计这两个系统都将有助于我们生产力的范式转变,在科学研究和领导力的各种关键领域取得无与伦比的收益,“橡树岭领导力计算设施科学总监 Bronson Messer 说。“我们很高兴 Discovery 和 Lux 能够扩展研究人员在橡树岭能够进行的科学研究。Discovery 将为融合 HPC、AI 和量子计算能力的新水平奠定基础,提供与其他系统相关的额外洞察力,而 Lux 则极大地扩展了研究人员对专用 AI 资源的访问。因此,我们预计这两个系统都将有助于我们生产力的范式转变,在科学研究和领导力的各种关键领域取得无与伦比的收益。

AMD 董事长兼首席执行官 Lisa Su 博士表示:“十多年来,AMD 和 HPE 一直合作突破高性能计算的极限,提供能够实现发现和改变世界的解决方案“我们正在与橡树岭国家实验室一起,通过 Discovery 和 Lux 为研究人员提供支持,以加速创新并加强美国在科学技术方面的领导地位。”

Inside Discovery:下一代百亿亿次级超级计算机

Discovery 的科学进步将源于今天推出的 HPE Cray 超级计算 GX5000。基于可追溯到 50 年发布的 Cray-1975 的超级计算创新,HPE 为融合 AI 和 HPC 时代的超级计算设计了下一代基础设施。

HPE 将为橡树岭国家实验室构建两个下一代百亿亿次级超级计算机“Discovery”和 AI 集群“Lux”

HPE Cray 超级计算 GX5000 专为百亿亿次级而打造,具有跨 CPU、GPU、加速器、网络、软件、存储和液体冷却的最先进的端到端功能。通过利用新架构,Discovery 将提供:

  • 通过优化的空间实现更高的性能 – 与以前的版本相比,新平台专门用于扩展到百亿亿次级性能,密度更高,每个机架的数据中心空间减少了 25%。
  • 与 HPE Slingshot 的高性能互连 – 下一代 HPE Slingshot 为 Discovery 提供了现代、高性能的互连,可为 HPC、ML 和分析应用程序提供高带宽和低延迟。
  • 业界首创的 HPC DAOS 存储性能 – 在全新 HPE Cray 超级计算存储系统 K3000 的增强下,与 Frontier 相比,Discovery 每个存储机架的 IO/s (IO/s) 将增加 300%4,从而使 AI 应用程序能够以更高的生产力运行。作为业界首款采用嵌入式分布式异步对象存储 (DAOS) 开源软件的工厂制造存储系统,HPE Cray 超级计算存储系统 K3000 是一款经济高效的全闪存存储系统,是对基于 Lustre 文件系统的 HPE Cray 超级计算存储系统 E2000 的补充,后者也将在 Discovery 中亮相。
  • 下一代液冷和加速计算 – Discovery 将采用代号为“Venice”的下一代 AMD EPYC 处理器,以及 AMD Instinct MI430X GPU,可为建模、模拟和 AI 项目提供先进的性能和准确性。利用 HPE 50 年的液体冷却创新,Discovery 的计算基础设施将采用完全液体冷却,以优化超级计算环境中的能源效率和成本效益。

HPE 凭借一流的 AI 和 HPC 专业知识为客户提供端到端解决方案和服务。作为不可或缺的合作伙伴,慧与超级计算服务通过对组织基础设施和应用程序的完全统一管理方法,重点关注核心业务需求和持续创新,帮助提高成果。