广州超算中心
广州超算中心是广州市“科技一号工程”, 项目总目标是:立足广州、服务全国、放眼世界,建设提供高性能计算、高吞吐信息服务和海量数据处理能力的世界一流的超级计算中心,支撑广东省产业升级,推动广州科技创新,提高综合国力和国家科技竞争力。广州超算中心坐落在广州大学城中山大学东校区,总建筑面积42332平方米,其中机房面积约 8000 平方米、配电、制冷系统等设备附属用房面积约 9500 平方米。
天河二号意义
在大科学方面,天河二号可应用于宇宙科学、地球科学、生命科学、核科学等涉及人类生存和发展、蕴含科学理论重大突破的科研领域,是建设创新型国家的重大基础设施。
在大工程方面,天河二号可应用于大飞机、石油勘探、核电站、基因工程、大型装备设计制造等国家重大专项和重大工程领域,是解决大工程挑战性问题的重大支撑平台。
在产业升级方面,天河二号可应用于汽车、船舶、机械制造、电子产品等传统产业的升级转型,形成“创新、设计、制造”的完整产业链;可应用于节能、环保、生物制药、新材料、新能源等战略性新兴产业,是支撑产业创新发展的倍增器;还可直接带动微电子、光通信、软件研发等相关产业的发展,是引领高端信息产业发展的辐射源。
在信息化建设方面,天河二号与云计算有机结合,可应用于智慧城市、电子政务、互联网和物联网应用等领域,是服务于信息化建设的资源池。
天河二号为解决我国科技、经济和社会发展重大挑战性问题提供了核心手段,将为推进科技强国战略、建设创新型国家作出重大贡献。
天河二号硬件资源配置
天河二号硬件系统由计算阵列、服务阵列、存储子系统、互连通信子系统、监控诊断子系统等五大部分组成。
天河二号硬件系统组成图
(1)计算阵列包含16,000个计算结点。每个计算结点包含2个多核中央处理器和3个众核加速器。
天河二号计算阵列单机柜效果图
天河二号计算结点主板
(2)服务阵列包含4,096个操作结点。每个操作结点包含1个自主研制的FT-1500多核中央处理器。服务阵列主要承担高吞吐率和高安全的信息服务类应用,例如电子政务和云计算应用。
天河二号操作结点主板
(3)存储阵列采用层次式混合共享存储架构,实现大容量、高带宽、低延迟的共享存储功能。
天河二号存储架构图
(4)互连通信子系统为自主定制的高速互连系统,采用光电混合技术、胖树拓扑结构、点点带宽160Gbps,可高效均衡扩展。
(a)天河二号互连交换芯片 (b)天河二号通信接口芯片
(c)天河二号NRM板 (d)天河二号SWM板
(e)天河二号BTM板
(f)天河二号BPM板
(5)监控诊断子系统实现全系统实时安全监测、系统控制和调试诊断功能。
天河二号监控诊断子系统架构图
天河二号软件资源
天河二号软件系统采用高性能计算软件栈架构,由操作系统、文件系统、资源管理系统、编译系统、并行开发工具、应用支撑框架和自治管理系统等构成,形成了系统操作环境、应用开发环境、运行支撑环境和综合管理环境等四大环境。
天河二号高性能计算软件栈架构图
(1)系统操作环境包括操作系统、并行文件系统和资源管理系统。操作系统采用64位Kylin麒麟操作系统,可广泛支持第三方软件;并行文件系统采用大规模层次式混合存储架构。资源管理系统提供全系统资源统一视图,实现了多策略资源分配与作业调度。
天河二号资源管理界面
(2)应用开发环境包括串行编程语言、并行编程模型和并行开发工具。串行编程语言包括C、C++、Fortran77/90/95等。并行编程模型包括面向异构协同计算的OpenMC,以及传统的OpenMP、MPI。并行开发工具提供一体化的并行调试和性能分析功能。
天河二号并行开发调试和性能分析界面
(3)运行支撑环境包括多领域并行编程框架、科学数据可视化系统和高性能计算应用服务与云计算平台。
天河二号科学数据可视化系统界面
(4)综合管理环境主要包括自治故障管理系统。
天河二号自治故障管理系统界面