解决当今最复杂的科学挑战通常意味着追踪数百、数千甚至数百万个变量之间的联系。科学数据集越大,这些连接就越复杂。
将原子结构转换为图形,其中原子被视为节点,原子间键被视为边缘。图片来源:Max Lupo Pasini/ORNL
随着实验随着时间的推移产生PB级甚至EB级的数据,跟踪药物发现、材料开发或网络安全等过程中的联系可能是一项艰巨的任务。
值得庆幸的是,随着人工智能的出现,研究人员可以依靠图神经网络(GNN)来绘制连接并解开它们之间的关系,从而大大加快解决问题的时间,进而加快科学发现的时间。
美国能源部橡树岭和劳伦斯伯克利国家实验室(ORNL和LBNL)的研究人员正在发展GNN,以在美国最强大的计算资源上进行扩展,这是应对当今以数据为中心的科学挑战的必要步骤。
ORNL 的 Massimiliano “Max” Lupo Pasini、Jong Youl Choi 和 Pei Zhang 在 2023 年 11 月 27 日至 30 日举行的 Learning on Graphs 2023 会议上分享了多机构团队的发现。他们的教程“使用 HPC 和超级计算设施进行可扩展图神经网络训练”说明了如何在 DOE 的领先级计算系统上扩展 GNN。
具体来说,该团队在LBNL的国家能源研究科学计算中心以及橡树岭领导计算设施的Summit和Frontier超级计算机上展示了HydraGNN在Perlmutter系统上的扩展。Frontier 是世界上第一个百万兆次级系统,目前被评为世界上最强大的计算机。
HydraGNN 是 ORNL 品牌的 GNN 架构实现,旨在快速准确地预测材料特性。它通过将固体材料的晶格结构抽象为图形来使用原子信息,其中原子由节点表示,金属键由边缘表示。这种表示自然地包含了有关材料结构的信息,从而消除了更传统的神经网络所需的计算成本高昂的数据预处理的需要。
“科学进步需要发现和设计具有改进的机械和热力学性能的材料,而 HydraGNN 是一种很有前途的替代模型。一旦在大量第一性原理数据上进行训练,该模型就可以提供快速准确的材料特性估计,而所需计算时间只是最先进的基于物理的模型的一小部分,“ORNL计算科学与工程部研究员Pasini说。“HydraGNN 生成预测的速度提高了,为有效的材料发现和设计提供了独特的探索能力。”
该团队的教程分为五个部分。第一个强调了科学应用,这些应用推动了可扩展的GNN替代模型的开发,以加速复杂物理和工程系统的研究。第二个提出了使用大量科学数据在能源部领导级超级计算设施上扩展GNN的必要性。第三个涵盖了 HydraGNN 的可扩展性和灵活性,这使得它可以在多个 DOE 系统中移植。第四部分介绍了在开源数据集上运行 HydraGNN 的示例,第五部分也是最后一部分包括教程和结束语。
该教程在 YouTube 上进行了直播,从 1:01:00 开始提供。HydraGNN 的改进功能最近也记录在用户手册中,该手册已通过 ORNL 技术报告向公众发布.
该研究是ORNL人工智能计划的一部分,该计划是一项内部投资,致力于确保安全、可信和节能的人工智能为科学研究和国家安全服务。通过该计划,ORNL的研究人员利用实验室的计算基础设施和软件能力,加快了解决方案的时间,并在具有国家和国际重要性的项目中实现了人工智能的潜力。
例如,该计划帮助多学科团队证明机器学习算法可用于从低信噪比的信号中提取信息,开发能够在很少的训练数据下加速建模和模拟的算法,并设计能够检测癫痫发作的新型仿生神经形态设备。
“扩展图神经网络带来了独特的挑战,”ORNL人工智能计划主任Prasanna Balaprakash说。“这些模型能够在广泛的科学数据集上进行训练,解锁了广泛的下游应用,特别是在新材料开发和药物发现方面。这一成就突显了我们致力于开发不仅功能强大、节能且可扩展的人工智能,确保我们始终处于科学研究和国家安全的最前沿。
UT-Battelle 为 DOE 科学办公室管理 ORNL,该办公室是美国物理科学基础研究的最大支持者。