英伟达全球副总裁沈威:仍然坚信「 GPU 天生适合深度学习任务」

By 微胖2017年9月12日 08:01

撰文 | 王艺


不可否认,GPU 为深度学习的大规模应用奠定了硬件基础。然而,随着人工智能时代的到来,深度学习技术专用芯片之争也愈发火热。芯片巨头英特尔大量收购人工智能相关公司,研发人工智能专用芯片,站台 FPGA,并已与很多垂直领域的企业进行合作;谷歌研制了基于硬件定义编程架构的 TPU;曾是英伟达重要客户的微软也开始为自己的数据中心研发基于 FPGA 的可重复编程 AI 芯片。此外,一些专业的人工智能公司,如科大讯飞等,也在研发适合自身业务的专用芯片。


GPU、FPGA、ASIC 是 AI 芯片市场打得火热的三种架构,其中 GPU 是当前的主流。与 CPU 相比,GPU 在硬件架构上拥有更多的计算单元,使其成为 AI 芯片的天然选择;FPGA 即现场可编程门阵列,是一种软件定义的架构,开发者可以通过编程定义片上单元的功能;ASIC 代指为专门目的而设计的集成电路,将功能烧制到芯片上,适合较为稳定的解决方案,且产品升级难度较大,但功耗较低。目前,FPGA 和 ASIC 还处于试验阶段,有能力使用 FPGA 的人工智能厂家并不多,绝大部分的 AI 芯片市场依然被英伟达占领,生态的构建并不容易,FPGA 与 ASIC 的 AI 之路也任重而道远。


在其他厂家积极开拓新战场时,英伟达仍然坚信「 GPU 天生适合深度学习任务」。9 月 7 日,英伟达全球副总裁、中国区企业事业总经理沈威在 AICC 上与机器之能就这一话题进行了讨论。沈威认为,英伟达 CUDA 运算平台是关键,CUDA 让 GPU 的计算能力得以释放,让普通的程序员也能用 JAVA、C++ 等编程语言在 GPU 上工作。


以下为采访实录,机器之能做了不改变原意的整理:


人工智能芯片战场愈发火热,不论芯片厂商还是 AI 领域的垂直公司都在试图抢占市场。这是是否英伟达的 AI战略造成影响?现在再提 GPU 是深度学习芯片的唯一霸主是否不再合适?


从 2012 年谷歌的李飞飞教授开启 ImageNet 以来,我们很开心看到 GPU 在人工智能市场的接受度很高,同时我们也看到很多跟随者。不过我觉得这是一件好事,首先,这意味着这些公司中的任何一家,对人工智能、深度学习这件事情都非常认同。不过我们在高性能运算、人工智能领域已经投入了很多年,具有先发优势。从历史的发展来看,深度学习为什么要用英伟达的 GPU?因为深度学习与高性能计算关系非常密切,深度学习任务中涉及到大量的运算,这是英伟达非常擅长的事情。


刚才我们说的是硬件方面,硬件很多半导体厂商都在做。但他们都忽略了一点,就是平台。我们的 CUDA 运算平台从 2006 年开始开放,到现在已经是第 9 代,CUDA 将 GPU 的高性能运算能力开放给一般的程序员。虽然半导体工艺是与时俱进的,但如果没有好的编程环境,技术人员们还是很难迎接这次深度学习的浪潮。这就间接回答了你的问题。不论哪家公司,可能他们在市场上也已经有很长时间了,但我个人认为,它的编程语言还不能针对数据中心的海量数据进行更便利地编程。大家可能看到,在深度学习时代,英伟达进行了一次面向人工智能的转型,但其实我们早已铺垫好相关能力。


现在 GPU、FPGA、ASIC 这三种架构都能完成深度学习任务,你对这三种架构的优劣势作何评价?


深度学习主要分为线下训练和线上推理,目前在线下训练用户无一例外地都在使用 GPU 加速他们的训练过程。不仅仅是因为 GPU 的运算速度快,更重要是英伟达建立了一个完善的生态系统,我们提供了许多 SDK 来加速所有深度学习框架,并和这些框架深度集成,如 cuDNN、NCCL、cuBLAS 等。在线上推理方向,英伟达目前的方案是 TensroRT 加低功耗的 NVIDIA Tesla P4 GPU 加速器。现在国内各大云服务提供商都在使用 Tesla P4 做线上推理,包括科大讯飞。


事实上,深度学习远没有成熟,每天都在变化演进、迭代,GPU 目前还是最佳选择。ASIC 是一种专用芯片,它是为了某种特定需求而专门定制的芯片,目前还不能与 GPU 这样拥有很成熟生态的通用芯片同日而语。FPGA 的生态系统才刚刚开始,道路还很漫长。


英伟达在无人驾驶和智能家居方面推出了自己的专用芯片,是否意味着英伟达看重这两个应用领域?更广阔的例如金融、医疗方面为何没有专用芯片的布局? 


GPU 天生解决深度学习问题,人工智能本身和人脑有很多类似的地方,需要眼睛看,脑子想。英伟达希望在 GPU 最擅长、最深耕的视觉运算上发力,因此英伟达在自动驾驶和嵌入式端布局了两种产品。其他领域我们也非常地看好,金融、医疗、制造是国内外爆发增长的几个 GPU 应用点,在这些领域我们有很多的合作伙伴。英伟达处在整个 IT 生态圈中,我们必须要跟不同行业的公司进行合作。


目前英伟达的生态圈中,有哪些比较坚实的合作伙伴?


我们有不同层次的合作伙伴。一种是跟服务器厂商的合作,因为在硬件层面单单为用户提供 GPU,用户是没有办法使用的,浪潮,曙光,华为等都是我们的合作伙伴;还有就是行业解决方案层面,在一个整机做好之后,可能会需要针对不同行业,例如医疗、制造业等等进行优化,以适合客户不同的应用场景,在这个层面科大讯飞、商汤都是我们的合作伙伴,我们叫 Solution Partner。


这些合作伙伴做得都很好,因为深度学习才刚刚开始,很少有人在用过 CUDA 开发环境之后说不喜欢英伟达。因为你不可能自己从零开始写一些函数库、优化库,我倒是很好奇,不用英伟达的人他们要怎么做。深度学习解决方案提供商们在算法和数据方面都有自己的努力,但是如果没有我们 GPU 的加速,他们的更新迭代和开发速度就会大大降低,走向市场的周期也会被拉长,所以我们也是帮助他们更快走向市场的必不可少的要素。


现在有很多中小企业或高校实验室不能负担大规模的 GPU 集群,英伟达是否想要争取这一部分市场?


其实我们也有关注到这一方面。我们和全世界很多大公司一样,会和很多高校合作教育、培训相关的项目,现在非常多高校在他们的计算中心里面有 GPU 集群,并且我们也有合作开设相关课程。另一方面,我相信大家也注意到了云计算的发展,现在国内几家领先的云服务厂商都已经用到了英伟达非常多 GPU,所以他们也提供非常多基于 GPU 的方案。对于不想自己买设备的厂家来说,我觉得云服务是一种选择。云是一种趋势,能够更快捷地惠及新的开发者、新的初创公司。


声明:本文由机器之能(微信公众号:almosthuman2017)原创出品,版权归作者所有,转载请查看要求,机器之能对于违规侵权者保有法律追诉权。