赛灵思重押AI应用加速,推出7nm软硬件可编程芯片Versal

Versal 基于台积电的 7 nm FinFET 工艺技术,集成Arm Cortex-A72,Cortex-R5处理器,采用AI引擎和DSP引擎,

10月16日机器之心消息,赛灵思推出首款7nm 制程的软硬件可编程芯片Versal系列,基于ACAP异构加速平台。

ACAP被视为赛灵思的“杀手锏”,今年三月问世,全称为Adaptive Compute Acceleration Platform, 自适应计算加速平台。它突破了此前FPGA只能在硬件层面编程的限制,同时具备更强的软件编程能力,片上网络能够直接和线上网络进行沟通,适用于机器学习、5G通信等多个领域。

此外,赛灵思面向云端和本地数据中心推出加速器卡Alveo,可用于实时机器学习推断以及视频处理、基因组学、数据分析等关键的数据中心等应用,能够以较低时延实现突破性的性能提升。目前,Alveo FPGA已开始接受量产订单。与所有赛灵思技术一样,用户能对硬件进行重配置,从而针对工作负载迁移、新标准和更新的算法进行优化,而且无需支付替代产品衍生的成本。

“随着 AI 和大数据的爆炸性发展以及摩尔定律的放缓,行业已经走到了一个关键的转折点。芯片设计的周期已经无法跟上创新的脚步。”赛灵思总裁及CEO Victor Peng在面向中国的2018年赛灵思开发者大会谈道。赛灵思的数据中心副总裁 Manish Muthal 谈到Alveo时表示, Alveo 加速器卡的推出进一步推进了赛灵思向平台公司的转型,能够进一步提升赛灵思应用合作伙伴生态系统的增长速度。

Versal 基于台积电的 7 nm FinFET 工艺技术,集成Arm Cortex-A72,Cortex-R5处理器,采用AI引擎和DSP引擎,支持各种协议引擎,以及丰富的扩展接口和外围。该产品组合包括 6 个系列的器件,其独特架构针对云端、网络、无线通信至边缘计算和端点等不同市场的众多应用提供了可扩展性和 AI 推断功能。

目前,赛灵思已经通过早期试用计划与重要客户合作。Versal Prime 系列和 Versal AI Core 系列将于 2019 年下半年上市。  

在开发组件方面,Versal ACAP 整合标量处理引擎、自适应硬件引擎和智能引擎以及前沿的存储器和接口技术,能为所有的应用提供强大的异构加速功能。不过,最重要的是, Versal ACAP 的硬件和软件均可由软件开发者、数据科学家和硬件开发者进行编程和优化,这主要基于赛灵思符合业界标准设计流程的一系列工具、软件、库、IP、中间件和框架。

Versal 产品组合包括 Versal 基础系列( Versal Prime),Versal 旗舰系列 (Versal Premium旗舰)系列和 HBM 系列,能针对要求最严格的应用提供业界领先的性能、连接性、带宽和集成功能。

该组合中率先亮相的是 Versal Prime 系列,跨多个市场提供广泛的适用性,同时推出的还有 Versal AI Core 系列,相对于业界领先的 GPU,AI 推断性能预计能提升 8 倍。

活动现场,赛灵思将Versal与高端CPU和GPU的AI推断性能上的指标对比,在强调7ms、2ms的低延时限制之下,Versal的性能优势明显,结合深鉴科技剪枝和量化技术,性能将进一步提升。

Versal系列还包括 AI 核心系列(AI Core),AI 边缘系列 ( AI Edge) 和 AI 射频系列(AI RF),采用突破性的 AI 引擎。AI 引擎是一种新型硬件模块,专为解决各种应用低时延 AI 推断的新需求而设计,同时支持高级 DSP 实现方案,满足无线和雷达等应用要求,同时能够满足一定5G要求。它与 Versal 自适应硬件引擎紧密结合,支持整体应用加速,也就是说软硬件都能调节,从而确保最高性能和效率。 

 Alveo加速器卡方面,赛灵思介绍,就机器学习而言,Alveo U250实时推断吞吐量比高端 CPU高出20倍,相对于高端 GPU等固定功能的加速器,能让 2 毫秒以下的低时延应用性能提升 4 倍以上。此外,Alveo 加速器卡相对于 GPU 能将时延减少 3 倍,在运行实时推断应用时提供显著的性能优势。数据库搜索等一些应用可从根本上得到加速,性能比 CPU 高90 倍以上。

目前,Alveo已经得到合作伙伴和 OEM 厂商生态系统的支持,关键应用涵盖 AI/ML、视频转码、数据分析、金融风险建模、安全和基因组学等,有14 家生态系统合作伙伴开发完成的应用可立即投入部署,国内方面包括华为、阿里云、浪潮等。

此外,部分OEM 芯片厂商将和赛灵思进入更深入合作,认证采用 Alveo 加速器卡的多个服务器 SKU,包括 Dell EMC、Fujitsu Limited 和 IBM 等。

产业versal7nm软硬件可编程赛灵思
相关数据
深鉴科技机构

深鉴科技成立于2016年3月,定位为深度学习硬件解决方案公司,将以自主研发的深度压缩与深度学习处理器(DPU)为核心,打造最好用的解决方案和最高效的整体系统,提供硬件+芯片+软件+算法的完整方案,方便所有人使用。同时,深鉴主要瞄准智慧城市和数据中心两大市场,可帮助用户为多种智能安防场景打造稳定高效的解决方案。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

剪枝技术

剪枝顾名思义,就是删去一些不重要的节点,来减小计算或搜索的复杂度。剪枝在很多算法中都有很好的应用,如:决策树,神经网络,搜索算法,数据库的设计等。在决策树和神经网络中,剪枝可以有效缓解过拟合问题并减小计算复杂度;在搜索算法中,可以减小搜索范围,提高搜索效率。

边缘计算技术

边缘运算(英语:Edge computing),又译为边缘计算,是一种分散式运算的架构,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理。边缘运算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。边缘节点更接近于用户终端装置,可以加快资料的处理与传送速度,减少延迟。在这种架构下,资料的分析与知识的产生,更接近于数据资料的来源,因此更适合处理大数据。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

卡方技术

卡方常常与卡方分布和卡方检验联系在一起: 卡方分布(chi-square distribution)是常用于概率论和统计检验中的一种概率分布;卡方检验是(chi-square test)是一种基于卡方分布的常用的统计检验,其统计量在原假设(null hypothesis)成立时服从卡方分布。

摩尔定律技术

摩尔定律是由英特尔创始人之一戈登·摩尔提出来的。其内容为:积体电路上可容纳的电晶体数目,约每隔两年便会增加一倍;经常被引用的“18个月”,是由英特尔首席执行官大卫·豪斯所说:预计18个月会将芯片的性能提高一倍。

推荐文章
暂无评论
暂无评论~