参与李泽南

至强三代面世:英特尔发布「最懂AI的CPU」,推理速度提升80%

经过漫长的等待,英特尔 Cooper Lake 架构芯片终于发布了。

今天,英特尔推出了基于 Cooper Lake 架构的至强三代处理器。作为业界首个内置 bfloat16 数字格式支持的主流服务器处理器,三代至强可扩展处理器能够大幅度提升图像分类、推荐引擎、语音识别和语言建模等应用的 AI 推理和训练,并在通用架构上快速部署。

在上午举行的英特尔数据创新暨新品发布会上,公司副总裁、至强处理器与存储事业部总经理 Lisa Spelman 对新一代 CPU 进行了介绍。

「快速部署 AI 和数据分析对当今各类企业至关重要,」Spelman 表示。「英特尔一直致力于不断强化处理器的内置 AI 加速能力和软件优化优势,以更好地为全球的数据中心和边缘解决方案提供动能,并通过打造无与伦比的芯片,助力释放数据中的更多洞察。」

在 Cooper Lake 中,英特尔主要加入了三项改进:基于 AVX512 的 BF16 指令,加倍的内部互联带宽,对于更快内存速度的支持。

英特尔在第三代至强处理器中加大了在内置 AI 加速方面的投入,其中最令人关注的是其将 bfloat16 格式支持整合到了独有的深度学习加速技术当中。bfloat16 是一个精简的数据格式,与如今的 32 位浮点数(FP32)相比,bfloat16 只通过一半的比特数且仅需对软件做出很小程度的修改,就可达到与 FP32 同等水平的模型精度。

新增的 bfloat16 支持同时为 CPU 的 AI 训练和推理性能提供加速。英特尔针对领先的深度学习框架(包括 TensorFlow 和 PyTorch)优化过的版本将支持 bfloat16,并通过英特尔 AI 分析工具包即可获得。英特尔同时为 OpenVINO 工具包和 ONNX Runtime 环境提供 bfloat16 优化,以简化推理的部署工作。

英特尔表示,第三代英特尔至强可扩展处理器是英特尔面向四路、八路处理器市场的产品。这一处理器专为深度学习、虚拟机(VM)密度、内存数据库、任务关键型应用及分析密集型工作负载而设计。

除了这些升级之外,新处理器沿用了 14 纳米制程,基础频率提高了 200MHz,加速频率提高了 300MHz,但同时功耗也有增长(增加了 45W)。对于那些将老旧基础设施进行更新换代的客户来说,与使用寿命已达 5 年的同等级四路平台相比,其有望在常见工作负载 3 上获得预计约 1.9 倍的提升和高达 2.2 倍的虚拟机提升。

英特尔为 AI 与数据分析打造了丰富的产品组合与生态系统支持。这家公司希望通过全面优化的数据平台与合作伙伴们一道,帮助各类企业积极部署智能的 AI 和数据分析服务,从而将数据转变为企业的重要资产。

与此同时,英特尔还发布了新一代内存、AI 芯片等一系列新产品。

作为第三代至强可扩展平台的一部分,英特尔发布了英特尔傲腾持久(Optane)内存 200 系列,为客户提供每路最高达 4.5TB 的容量,以进行内存数据库、密集虚拟化、分析及高耗能计算等数据密集型工作负载的管理。新一代 Optane 的内存带宽比前一代高 25%。

针对使用全闪阵列存储数据的系统,英特尔发布了新一代高容量 3D NAND 固态盘:SSD D7-P5500 和 P5600。这些 3D NAND 固态盘采用了最新的 TLC 3D NAND 技术以及全新低延迟 PCIe 控制器,能够满足 AI 及分析工作负载的密集 IO 需求,并具有提高 IT 效率和数据安全性的高级功能。

此外,英特尔还披露了即将发布的 Stratix 10 NX FPGA——首个针对高带宽、低延迟 AI 加速所打造的 AI 优化 FPGA 产品。此类 FPGA 可针对自然语言处理、欺诈识别等具有高计算要求的应用程序为客户提供可定制、可重新配置、可扩展的 AI 加速。Stratix 10 NX FPGA 配备集成式高带宽内存(HBM)、高性能网络功能以及最新 AI 优化算法模块 AI Tensor Block,其含有 AI 模型算法常用的低精度乘法器密集阵列。

英特尔在活动中介绍了 OneAPI 跨架构开发工具。随着多样化客户需求的增加 oneAPI 跨架构工具的功能正在变得越来越丰富,其可以帮助开发者简化异构编程的流程、加速性能、提升生产力。凭借这些高级工具,开发者可在英特尔 CPU、GPU、FPGA 上实现 AI 工作负载的加速,并使代码可以在已有和即将发布的英特尔处理器及加速器上获得兼容。

部分搭载第三代英特尔至强处理器及英特尔傲腾内存 200 系列的产品已开始陆续交付。5 月,Facebook 曾宣布将基于第三代英特尔至强可扩展处理器打造其最新的开放式计算平台(OCP)服务器。其它大型云服务提供商,如阿里巴巴、百度和腾讯也已宣布采用英特尔新一代处理器。通用 OEM 系统配置预计于 2020 年下半年推出。

英特尔 SSD D7-P5500 和 P5600 3D NAND 固态盘已经开售,Stratix 10 NX FPGA 则将于 2020 年下半年开始交付。

AI 和大数据正为金融、健康医疗、工业、通信及交通等多行业开启了全新的机遇。据 IDC 预测,到 2021 年,75% 的商业企业的各类应用将应用人工智能;而到 2025 年,人类生产的所有数据中将有约四分之一是实时产生的,而在这一庞大的增量中有 95% 的数据将通过各种物联网设备产生。这其中的机会,对于所有芯片厂商来说都极具吸引力。

此次峰会上,二十余家合作伙伴见证了英特尔以数据为中心平台产品组合的发布,并分享了英特尔产品与解决方案在各行业的成功部署。

当日活动还首次上线了英特尔人工智能实践日活动,其面向 AI 工程师和开发者,整合了基于英特尔架构的优化开源框架、 软件、工具及库做统一的培训,并直接邀请参与者动手实验。英特尔全球AI技术总监伊红卫表示,希望能够「共建生态,共赢未来」,这是英特尔的生态之道。

英特尔表示,现阶段该公司不仅着眼于制程技术,而会在包括计算、存储、网络、软件、硬件、架构和生态等方面共同发力。今年 2 月,英特尔已宣布在 5G 基站和客户端开始交付 10nm 处理器,在今天的活动中,英特尔也确认了采用 10 纳米制程的 Ice Lake 处理器将于今年晚些时候问世。

参考内容:

https://www.anandtech.com/show/15862/intel-launches-cooper-lake-3rd-generation-xeon-scalable-for-4p8p-servers

产业FPGA英特尔
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

5G技术

第五代移动通信系统(5th generation mobile networks),简称5G,是4G系统后的延伸。美国时间2018年6月13日,圣地牙哥3GPP会议订下第一个国际5G标准。由于物理波段的限制,5G 的网络也将会与其他通信技术并用,包含长距离的其他传统电信波段。

推荐文章
暂无评论
暂无评论~