/ 中存储网

英伟达告诉你,深度学习需要怎么样的新型高性能计算

2016-11-04 10:58:36 来源:ZDNet

今天深度学习无处不在,当你打开移动终端的时候,各种APP会推荐到你喜欢的食物、你喜欢的电影,你关注的新闻热点。在生活中更是改变着我们,今天的智能语音让语言障碍破除,在预测疾病基因大数据领域预测疾病来确定药物治疗方案。在安全领域通过安装在机场和商场的智能视频监控,提高了公共安全性。可以说,深度学习的应用,彻底改变了今天人们的生活。

在上世纪九十年代PC-互联网时代以微处理器、标准操作系统、以及信息世界新门户的结合推动社会的进步,代表有CPU、WINDOWS、各类门户网站。PC-互联网时代让大约10亿人获得了计算能力,并实现了微软“让每台办公桌和每个家庭都有一台电脑”的愿景。

进入二十一世纪,移动互联与云计算的发展,移动终端的普及、公有云AWS的推出,诞生了移动-云时代。大量应用进入我们的日常生活, 30亿人享受着移动计算带来的自由。同时也让人工智能、深度学习等技术爆发。

那么今天,我们正站在由GPU深度学习的新计算模式引发的人工智能计算时代的开端。我们需要适应深度学习的高性能计算GPU、需要开放的移动操作系统、以及基于云的新连接窗口。而这一切应用的背后需要新型的高性能计算。

不同于“指令处理”密集型的老式计算模型,基于深度学习全新计算模型需要海量“数据处理”。为了在各方面推进深度学习,NVIDIA正在建立一个端到端人工智能计算平台——即一个跨越训练、推理和数十亿正在使用的智能设备的架构。

深度学习作为全新的计算模型,正在改变计算的方方面面,不仅改变了软件开发的方式、开发地点和运行方法,还在改变着服务器架构、数据中心和智能设备。在深度学习的训练方面,网络的设计和训练都需要数万亿次的运作,而GPU使其切实可行,可训练更有深度更准确的模型,加速产品上市时间。在数据中心推理方面,对于云服务来说,网络将运行在数据中心里,每天经历数以万计的图片、声音和视频的查询,而GPU推理可快速回应,实现数据中心吞吐量最大化。在设备推理上,即使面对数十亿智能设备的运行规模,GPU也能做出实时精确响应。

深度学习最苛刻的部分是训练,对于深度学习来说,需要每次训练运行数十亿TFLOPS,采用传统CPU需要进行数年计算的时间,而GPU将数年缩短为数天。同样推理过程,每次推理运行数十亿FLOPS,GPU可以即时响应。

那么英伟达基于深度学习的技术的优势以及深度学习对数字化转型的作用是什么?英伟达解决方案与工程架构副总裁 Marc Hamilton与英伟达全球副总裁,中国区企业事业部总经理沈威有着深入的看法。

NVIDIA告诉你,深度学习需要怎么样的新型高性能计算

英伟达解决方案与工程架构副总裁 Marc Hamilton

深度学习的基础是数学计算,英伟达擅长的就是数学计算

英伟达解决方案与工程架构副总裁 Marc Hamilton谈到,无论深度学习DL还是人工智能AI,还是高性能计算HPC,都有一个共同的基础,就是一个数学计算的基础。包括计算机显示技术,以及VR,虚拟现实,它也是数字计算作为一个基础。NVIDIA从成立到现在一方面特别擅长于进行数字计算,数学计算。另外一方面特别擅长做就是并行处理,也就是说在同一个时间里面,几百个数学的计算,它可以同时进行处理。这样2006年NVIDIA推出CUDA,实现了图像处理器的可编程。

第一个最早用CUDA,就是把这个CUDA用在GPU系统上来进行计算的第一个用户,就是高性能计算的用户。因为他们有一些非常复杂的数字计算,需要在GPU上把这些数字转化成图像来进行一个信号和数字的处理。2012年的时候,也是历史上第一次,是一个大学的研究人员,他将原来传统上的说法,叫做深度神经网络,就是DNN网络,以前是在CPU上进行,现在也放在了GPU上来进行并行计算。

可以看出NVIDIA在图像处理的领域、传统的领域,还是在整个虚拟现实、VR的这些领域,以及深度学习和高性能计算的这些领域,在积极拓展。

对于深度学习和人工智能,Marc Hamilton认为现在基本上所有的大型IT公司,都认为无论是深度学习还是人工智能,代表着一个非常巨大的新的市场。所以从英伟达的角度来说,十年前就已经开始投资在CUDA上。五年前,又开始大量的投资在深度学习上面,未来会继续在这个路线图进一步的加强投资。

NVIDIA DGX-1系统领跑深度学习

包括NVIDIA推出全面领先的Tesla平台,其中今年推出的Tesla P100实现了全球最快计算节点的全新GPU架构,其采用Pascal架构,拥有最高的计算性能,在扩展性实现GPU互连,实现了最大可扩展性,同时将计算和内存整合封装在一起,在页面迁移引擎上实现简单并行编程与几乎无限的内存空间。Tesla P100 NVLink能够可扩展到多个GPU上运行应用程序的超大规模和高性能计算数据中心。Tesla P100,拥有3840个FP32单精度、1920个FP64双精度CUDA核心,主要面向高性能计算领域。

而NVIDIA DGX-1 是首款专为深度学习而设计的系统,具备充分集成的硬件、深度学习软件以及开发工具,让开发者能够快速而轻松地进行开发。它是一款全套系统,包含新一代 GPU 加速器,吞吐量相当于 250 台 x86 服务器。同时在性价比和能耗方面有明显的优势。“比如说一个传统服务器的话,大概是一万美元左右。但是如果我们DGX-1全面的深度学习超级计算机的话,它在美国的售价大概是12万9千美元。但是如果你有这么一台DGX-1之后,它可以替代掉的基于CPU的传统服务器是250台。哪怕CPU的服务器再便宜,哪怕它是一万美元,甚至一万美元不到,你把它乘上250倍,我可以跟大家保证,一定会比DGX-1要贵,而且能耗也一定比DGX-1要高的多。” Marc Hamilton谈到。

NVIDIA告诉你,深度学习需要怎么样的新型高性能计算

英伟达全球副总裁,中国区企业事业部总经理沈威

NVIDIA最终要为社会数字化转型服务

高性能计算对于社会数字化转型影响是深刻的,英伟达全球副总裁,中国区企业事业部总经理沈威表示,NVIDIA最终目的是要为社会数字化转型服务。一方面是数字化资料的深度学习,一方面是智慧城市的建设。

一方面,基于已经被数字化的资料,这是一个领域。包括大家耳熟能详的AlphaGo,后面的运算能力就是由英伟达公司的GPU来支持的。AlphaGo就是从原来的15万个围棋的系统输入,然后用深度学习的方法,再产生了总共3000万个棋谱,都是图像。也就是数字化的图像,然后透过运算,产生了运算的结果。同样的类似的模型,在国内,比如说现在一些政府,跟医疗,跟学校、医学院合作,类似像AlphaGo的概念,在做医疗影像,怎么样来更好的透过这些数字化的影像,来更好的帮助对人脑、对癌症的学习、认知。

第二个领域智慧城市安防工程,包括公安体系,我们NVIDIA在做IVA,就是智慧的、图像的、影像的分析。“比如说今天看到很多过去我们只有在电视、电影中看到的场景,我就把一个疑犯的相片拿出来,我怎么可以在一个我们大家指定的时间内来抓到或者找到一些我们需要的以及特殊的载体或物体。” 沈威谈到,这些都需要大量的数字化的图像。英伟达认为当这些社会需求加入了深度学习之后会产生深刻的影响。这样是整个数字化社会跟英伟达深度学习的一个结合。