Tony Peng作者

英特尔第一届 AI 开发者大会:从芯片到软件看英特尔 AI 雄心

英特尔严肃看待人工智能。去年,这家 50 岁的芯片巨头和 CPU 市场领导者成立了 AI 产品事业部(AIPG),由副总裁 Naveen Rao 领导,他曾创立 Nervana,该公司于 2016 年被英特尔收购。

在今早的 keynote 演讲中,Rao 称英特尔的目标是为 AI 开发者搭建完美的计算平台:「定义工具,帮助工程师解决问题。」Rao 介绍了开发者将从英特尔 AI 平台的计算能力、优化软件工具和社区中得到哪些收获。

英特尔 Nervana 芯片新一代:Spring Crest

英特尔提供多种处理器来满足大量 AI 应用的计算需求:Xeon 处理器适合一般计算任务;Nervana 神经网络处理器适合训练 AI 模型;Movidius 视觉处理芯片适合在嵌入式 IoT 设备上进行图像/视频处理;FPGA 适合在云端和边缘设备上进行 AI 推断。

英特尔今天最大的举措是宣布 Nervana Neural Net L-1000(代号 Spring Crest)将在 2019 年上市,该芯片将是英特尔第一款商业神经网络处理器(NNP)。预计 Spring Crest 的训练速度是上一代 Lake Crest 的 3-4 倍。

Spring Crest 为高利用率和模型并行化而设计,将达到高于 96.4% 的 GEMM 计算利用率、96.2% 的多芯片扩展效率、2.4 TB/s 的多芯片通信速度,这一切是在总功率低于 210 瓦的单芯片中实现的。

Spring Crest 将支持 bfloat16,一种新兴的业界通用神经网络数字格式。英特尔期望能够很快将 bfloat16 支持扩展至其整个 AI 产品线,包括 Xeon 处理器和 Intel FPGA。

英特尔是 AI 专用处理器方面的后来者,急于追上 GPU 市场领导者,如英伟达和 AMD。英特尔还可能关注谷歌,后者在前不久的 I/O 大会上宣布最新迭代的 AI Tensor 处理单元 TPU 3.0。

软件优化战争升温

除了高性能芯片和框架,AI 开发者真正想要的还有高效的软件工具,可以帮助简化工作流、节约时间和金钱。这就是英特尔和其他科技巨头公司(如英伟达、谷歌和微软)都在推动软件工具开发的原因。

英特尔 AI 软件产品负责人 Jason Knight 展示了 nGraph,一种可在多个框架和硬件上运行模型的深度学习编译器和运行时系统。当开发者想要把一个训练好的模型迁移到另一个框架或升级设备时,nGraph 可使开发者免于繁重的编译和优化工作。

nGraph 核创建了一种强类型、device-neutral stateless 计算图表征、一个连接 nGraph 核和框架的纽带,以及连接 nGraph 核和设备的 transformer。

nGraph 编译器海报

今年三月 nGraph 开源,现在支持 Apache MXNet、Neon、PaddlePaddle、TensorFlow 和 ONNX 等框架。Facebook 拥有类似的机器学习编译器 Glow,可在不同的硬件平台上加速框架性能。但是 Glow 仅支持 PyTorch。在硬件方面,nGraph 支持 Xeon、Nervana NNP、GPU 和不同的推断引擎。

英特尔还宣布了其开放性视觉推断 & 神经网络优化(OpenVINO)软件工具包,OpenVINO 适用于边缘设备(如摄像机和 IoT 设备)上的视觉推断和神经网络优化。OpenVINO 的推断引擎支持在 CPU、GPU、Intel Movidius 或 FPGA 上的推断,且无需更改算法或深度学习网络。

OpenVINO

Movidius 的应用场景

Knight 还介绍了谷歌 TensorFlow 和英特尔 MKL-DNN(Math Kernel Library for Deep Neural Networks)之间的整合,MKL-DNN 是一个开源性能库,用于在英特尔架构上加速深度学习应用和框架。该整合将使 Broadwall 和 Skylake 的 AI 推断速度加速为原来的三倍,在使用 64 节点簇(64 node cluster)训练时达到 94% 的效率,并且扩展 AI 训练。

C3 IoT、2020 东京奥运会

英特尔在多个行业中积极寻求联盟,今天英特尔宣布它将独角兽软件和 AI 公司 C3 IoT 展开合作,面向 AI 和 IoT 企业软件应用市场。

C3 IoT CEO Thomas Siebel(左)和英特尔副总裁 Naveen Rao 在英特尔 AI DevCon 大会上。

合作包括 C3 IoT AI Appliance,由英特尔 AI 提供支持,这是一项面向市场的项目,包括联合营销、销售、训练和快速原型,以加速用户在 AI 和 IoT 应用开发方面的成功。C3 IoT 还将加入 Intel AI Builders Program,该项目向合作伙伴提供资源和支持,以促使它们采用基于英特尔的 AI 平台。

英特尔还宣布它将成为 2020 东京奥运会的官方 AI 平台合作伙伴,今年早些时候英特尔承诺参与构建这次奥运会的大型 5G 网络。英特尔在今年 2 月份举办的平昌冬奥会上成功展示了大量新兴技术:无人机灯光秀、虚拟现实和 5G 通信。


英文原文链接:https://syncedreview.com/2018/05/23/intel-into-ai-new-conference-chips-partners/

产业英特尔Nervana开发者大会芯片框架软件平台
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

虚拟现实技术

虚拟现实,简称虚拟技术,也称虚拟环境,是利用电脑模拟产生一个三维空间的虚拟世界,提供用户关于视觉等感官的模拟,让用户感觉仿佛身历其境,可以及时、没有限制地观察三维空间内的事物。用户进行位置移动时,电脑可以立即进行复杂的运算,将精确的三维世界视频传回产生临场感。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

张量技术

张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 维空间内,有 个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。称为该张量的秩或阶(与矩阵的秩和阶均无关系)。 在数学里,张量是一种几何实体,或者说广义上的“数量”。张量概念包括标量、矢量和线性算子。张量可以用坐标系统来表达,记作标量的数组,但它是定义为“不依赖于参照系的选择的”。张量在物理和工程学中很重要。例如在扩散张量成像中,表达器官对于水的在各个方向的微分透性的张量可以用来产生大脑的扫描图。工程上最重要的例子可能就是应力张量和应变张量了,它们都是二阶张量,对于一般线性材料他们之间的关系由一个四阶弹性张量来决定。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

MXNet技术

MXNet是开源的,用来训练部署深层神经网络的深度学习框架。它是可扩展的,允许快速模型训练,并灵活支持多种语言(C ++,Python,Julia,Matlab,JavaScript, Go,R,Scala,Perl,Wolfram语言)

推荐文章