美国国家科学基金会(National Science Foundation)的一系列超级计算奖项中的另一个已宣布,这是一项将在普渡大学(Purdue University)安装的系统的1000万美元资金,该系统将支持HPC和AI工作负载,并计划于明年投入生产。
该系统被称为Anvil,将与戴尔和AMD 合作制造,并将由1,000个128核AMD Epyc“ Milan”第三代7nm CPU组成,这些产品将于今年晚些时候推出。Purdue表示,该系统的峰值性能将达到5.3 petaflops,并将在5年内为NSF的极限科学与工程发现环境(XSEDE)内的研究人员提供超过10亿个CPU核心小时。Anvil节点将与100 Gbps Mellanox HDR InfiniBand 互连,其生态系统还将包括32个大内存节点,每个节点具有1 TB RAM,以及16个节点,每个节点具有四个Nvidia A100 Tensor Core GPU,可提供1.5 PF的单精度性能。
根据Purdue的说法,该系统将利用由10 PB以上的并行文件系统锚定并通过超过3 PB的闪存盘增强的多种块和对象存储技术集。进行中的项目和档案数据的存储将由Purdue的研究数据仓库和堡垒文档提供。
Anvil将包括旨在扩大访问范围的功能,例如交互式计算和可视化功能,以及到Anvil的软件工具和计算节点的基于Web的集成式Open OnDemand网关。可组合子系统将使基于云和容器的工作流能够与系统一起运行,并将支持科学应用,包括网关,数据库,高通量数据提取管道和复杂的耦合建模工作流。它将提供通往Microsoft Azure云的途径。
Anvil将与大学的社区集群超级计算机一起建造,其中包括为普渡大学校园建造的2020年“贝尔”系统,它将利用学校的基础设施,包括大容量存储系统,高速网络和ITaP(普渡大学的信息技术)自2008年以来已部署14台超级计算机的员工。
研究计算和该项目的共同PI的执行董事Preston Smith说,Anvil将针对传统并行计算进行优化,以用于流体动力学和生物信息学等领域的研究,以及数据科学,人工智能和机器学习应用。
“ Anvil还将作为一个经验学习实验室,让学生获得使用计算机科学知识的真实经验,并让实习生与Anvil团队合作进行建设和运营。我们将培训未来的研究计算从业人员。”他说。
该项目由国家科学基金会(NSF)授予,编号为2005632。该项目的计算科学家和高级研究科学家Xiao Zhu,以及研究计算的数据科学家,软件工程师和研究科学家Rajesh Kalyanam是该项目的联合PI。