首页 > 行业动态 > NVIDIA:GPU服务器时代即将到来,高效硬件赋能AI革命
NVIDIA:GPU服务器时代即将到来,高效硬件赋能AI革命
2018-02-01 16:00:59 7559

日前,全球顶级科技商业杂志《麻省理工科技评论》新兴科技峰会EmTech CHINA落地中国,大会汇聚数十位世界级科学家及科技公司领袖,分别以量子计算、机器学习和区块链为议题,分享了改变世界的新兴科技和前瞻观点。



NVIDIA首席科学家、研发高级副总裁BillDally应邀出席EmTech CHINA,并发表了题为《赋能AI革命:适用于深度学习的高效硬件(Fueling the AI Revolution: Efficient Hardware for Deep Learning)》的演讲,分享了GPU硬件方面的发展如何为AI革命注入动力,让更多新兴应用成为可能,进而不断解放劳动力,推进人类历史进程中的一大飞跃。


算法、算力和数据是人工智能的三项核心技术,Bill Dally提到,在这一轮AI革命中,硬件的发展和大数据方面的进步扮演了非常重要的角色。很多算法和神经网络早在80年代就已经登场,但直到近几年随着硬件及大数据领域的发展,AI才得以真正崛起。



 “我们以前一般需要两周时间进行训练,因为硬件的性能较低。一旦硬件的性能得以提升,就能大幅提升处理速度,从整体上推动AI的快速发展。”Bill说道。


近几年来,从Kepler架构到最新的Volta架构,GPU在GoogleNet上的性能实现了约11.5倍的增长。而聚焦最近两年,从Maxwell架构、到Pascal架构、Volta架构,更是达到了约每年3倍的性能提升。



在打造适用于深度学习的硬件时,除了性能,能效也是需要重点关注的问题之一。深度学习正在向着低精度运算的方向发展,通过降低计算精度,可将能源成本降低几个数量级。


硬件性能飞跃使得AI无处不在


如今,深度学习影响着人类生活的方方面面,包括交通、医疗保健、教育、娱乐等。关于机器学习的研究由来已久,从前机器需要学习很多参数,却只能实现简单的图像识别功能。但随着AI的发展,特别是神经网络技术的发展,我们现在能够更高效地基于复杂的数据进行训练,机器的学习能力也得以大幅提升。目前有些机器在自然语言处理、语音识别、游戏等领域的识别能力已经不亚于人类了。



无人驾驶汽车的发展在某种程度上也是由硬件性能的提高推动的。现在世界上用于深度学习的最先进的硬件设备就是基于 Volta架构的Tesla V100,它拥有120TFLOPS的计算能力,能大大提高深度学习的发展。它的速度比当年东京NEC公司推出的世界上最快的Earth Simulator计算机快了3倍以上。



对于物联网应用,NVIDIA也推出了相应的系统级芯片(SoC),它的特色之一就是利用了DOA体系结构,使它更适用于深度学习计算。它具有很强的稀疏性,大大提高了深度神经网络的运算速度。不仅如此,NVIDIA还提高了硬件产品的能效、缩小了硬件的体积。而为了更进一步提高硬件的运算效率,还进行了算法优化、层次简化。这些都会最终推动IoT的发展。


NVIDIA系统级芯片NVIDIADRIVE Xavier

 

另外,NVIDIA还将深度学习加速器(DLA)开源。DLA支持稀疏权重压缩,可节省内存带宽,且内置对Winograd卷积的支持,可提高某些尺寸的过滤器的计算效率。它具有可拓展性和高度可配置性,初创公司和研究机构都可以基于此开发推理加速器,赋能IoT——无论是成本敏感型的小型IoT设备,还是更加注重性能的大型IoT设备。




GPU硬件方面取得的进展,进一步促进了人工智能的革命。GPU在当下也被广泛认可为最适合于深度学习计算的硬件。当然,作为一家AI计算公司,NVIDIA不仅提供致力于推进计算能力发展的硬件创新,更提供完善的AI开发平台。“我们是一家提供解决方案的公司。我们提供的是平台——包括芯片、软件、以及能够助力客户解决未来难题所需的模型。”Bill最后总结道。


扫一扫,关注网烁公众号!
微信搜索“网烁”或“waso-vip