一年一度的ASC15世界大学生超级计算机竞赛于前不久在太原理工大学完美谢幕,清华大学再度夺魁。要说这和本文所讲有什么关系呢?说简单点,清华大学使用了NVIDIA赞助的GPU加速卡。当然,这样的开篇未免太过牵强,我们还是拔高到产业层面聊聊HPC(高性能计算)如今的发展现状。
清华大学夺魁
众所周知,HPC近两年受关注的程度越来越高。SC、ISC、ASC,光世界性的超算竞赛每年就有三场,像区域性的竞赛、行业会议更是数不胜数,究竟是什么促使HPC得以迅猛的发展?从根本来说,还是用户需求决定的。如今越来越多的行业依赖高性能计算来解决问题,对于HPC能力的需求自然直线上升,一方面要好的技术,另一方面要懂技术的人,同时当然还少不了上下游的解决方案供应商。
从技术层面来看,过去很长一段时间超级计算机采用的多是纯CPU架构,后逐渐演变为CPU+GPU的异构架构。至于为什么,原因也比较简单,GPU在浮点计算、图形、语音处理方面有着先天的CPU不可比拟的优势,CPU+GPU这样各司其职能够更好地发挥设备的效用。就这样发展至今,更多的超级计算机开始选用异构架构,于是NVIDIA、Intel和AMD在GPU领域开始了又一轮的争夺。
紧接着,产品技术、人才、解决方案……,围绕这些方面,参战选手自战斗开始起就纷纷进行了大范围的布局,本文所讲可以说是其中的一个方面,也就是生态圈中的人才培养。我们从小参加了那么多比赛,相信对于通过竞赛这种方式以赛促学的方式并不陌生,那效果用现在比较流行的口头禅来形容就是“棒棒哒”。
其实这一句就足以解释一个厂商为什么会赞助一个比赛。但实话说这个理由用在NVIDIA身上又不够充分,因为话说在GPU加速计算领域,NVIDIA不夸张地说已处于绝对领先的位置。请注意,这里不单指产品,同样包括人才培养、生态建设。在这样的市场局面下,NVIDIA依旧保持一颗谦虚的心赞助各种大赛仅仅是因为警惕心吗?
NVIDIA亚太区首席技术官Simon See
应该说有这样的成分,但不完全是。就像NVIDIA亚太区首席技术官Simon See在接受采访时所说的:“NVIDIA在GPU加速领域确实处于比较领先的态势,以CUDA为例,它是一个非常好的平台,也十分成熟。但是,要把CUDA用到非常好,需要掌握很多技术,经过很多层面的培训。而NVIDIA积极参加类似的比赛,就是想让大家知道在CUDA里面原来还可以找出更好的方式来优化CUDA应用。如果没有这样的竞赛,只能说是部分人会用而已。另外,从学生的角度来看,如果他只是学了一些CUDA的知识,可能并没有成就感,如果让学生来参与这样一个比赛,比一比谁能把CUDA用得更好,也能进一步促进CUDA在应用领域做得更好。”
简而言之,Simon表达了两层意思,给学生一个施展的平台,给大众一个更深一步了解CUDA应用的机会。具体而言,虽然前文只提到了清华大学,但实际上在ASC15中用到NVIDIA GPU加速卡的不止他们1家,还有台湾清华大学、上海交通大学、中山大学、浙江大学和新加坡南阳理工大学5支代表队也都使用的是NVIDIA的GPU加速卡。值得一提的是,新加坡南洋理工大学在ASC15中还打破了Linpack测试的世界纪录,并夺得该分项的冠军。
为什么这六支队伍会使用NVIDIA的产品?是偶然吗?当然不是,回到前文所提人才培养的问题,这就是其中的一个层面,很多高校与NVIDIA之间都有着合作关系。Simon表示,从NVIDIA的角度来看,是十分注重与学校之间的合作的,很多NVIDIA的应用也都是学生或者老师在从不同的角度试着解决一些问题时发现的。
对此,NVIDIA中国区销售总监袁永清还进一步做了补充。他说:NVIDIA与高校之间有三个类型的合作项目,一个叫做CCOE(CUDA卓越中心),目前在国内合作的大学有清华大学和上海交通大学,另一个项目叫做CTC,就是CUDA Training Center,还有一个项目叫CUDA Research Center,类似此次参赛的这些学校都跟我们有很深入的合作。
至于三个项目分别都是干什么的,其实从合作项目的命名就能略见端倪。Training Center,顾名思义主要是培训学生和老师,主要起普及的作用;Research Center则是面向研究领域的,老师或者教授如果在某一领域(比如流体力学等)希望利用CUDA进行比较深入的研究,可以向NVIDIA提出申请;最后一个CCOE包括的比较多一些,有科研、培训,以及多元化的一些合作。
回到NVIDIA为什么要赞助ASC世界大学生超算竞赛的问题中,此时应该也有了答案,持续不断地人才培养,才是平台向前不断迈进的根本,这一点什么时候都不能掉以轻心,因为有对手在紧紧地盯着你。