Arm在京推出最小DPU,强调合规情况下将不受限制地支持中国厂商

Arm 持续拓宽专用芯片产品线,押宝机器学习。

10 月 23 日机器之心消息,Arm 在北京举办年度技术研讨会,推出三款全新处理器 IP 设计,包括 Ethos-N57/Ethos-N37 NPUs,Mail-G57 GPU、最小面积的 Mali-D37 DPU。

三款 IP 采用 Arm AI 平台和最新的机器学习技术,面向数字电视的图形处理和显示需求,以及主流和入门级的移动设备处理。

过去一年里,Arm 推出了数个从网络终端到云端的全新解决方案,包括 Arm Project Trillium、Arm Neoverse、两个具有安全功能的全新 Automotive Enhanced 汽车强化处理器,以及专为安全管理物联网装置的 Pelion 物联网平台。
Ethos 系列是专门针对 AI 计算性能提升的 NPU,Ethos-N77 将作为机器学习专用处理器,为 AI 应用程序的关键性能提供保障;Ethos-N57 和 Ethos-N37,定位于推理处理器,用于视觉、语音等适用于家庭和移动场景。此外,Arm 还发布了配套的 arm NN 开发软件。
ARM Mail-G57 GPU 主要针对游戏的高能效计算需求和复杂的机器学习,能效提升了 30%,性能提升了 30%,机器学习性能提升了 60%。
Mali-D37 DPU 被 Arm 定义为最小面积的 DPU,首次采用 Komeda 架构,小于 1mm²面积可提供 2K 和全高清视频,系统的功耗和内存管理需求降低了 30%。
今年五月,Arm 已经推出旗舰 IP 方案,定义 2020 年高端智能手机性能,提供新一代的人工智能体验,分别包括:
1)面向移动市场的 Cortex-A77 CPU;
2)采用新架构满足高清游戏高性能的 Mail-G77 GPU;
3)满足高清显示效果面向 VR 应用的 Mail-D77;
4)Arm ML 处理器。
与此同时,Arm 还通过加强与新思科技的合作促进最新高级移动处理器(包含 Arm Cortex-A77 CPU 和 Mali-G77 GPU)早期采用者流片。
新思科技解决方案支持使用了 Arm 最新处理器的智能手机、笔记本电脑、其他移动设备、5G、增强现实 (AR) 和机器学习 (ML) 产品的优化设计,该解决方案包括新思科技 Fusion Design Platform、Verification Continuum 平台和 DesignWare 接口 IP。
Arm Cortex-A77 CPU,拥有比 Cortex-A76 设备高出 20% 的 IPC 性能提升,可带来先进的 ML 与 AR/VR 体验。
Mali-G77 GPU 利用全新的 Valhall 构架迎接这一挑战,与用在当前设备中的上一代 Mali-G76 GPU 相比,具有近 40% 的性能提升。Mali-G77 同时也在关键的微构架上进行强化,包括引擎、texture pipes 和 load store caches,并将功耗效率以及性能密度分别提升 30%。
Arm ML 处理器对应的是 Project Trillium,是一个异构 ML 运算平台,包括 Arm ML 处理器以及开源的 Arm NN 软件框架,目前已搭载在超过 2.5 亿台 Android 设备上。随着机器学习使用案例的需求越来越高,开发人员也对专属神经处理器(NPU)也更为渴望。
自从去年宣布推出 Project Trillium 后,Arm 已经针对 ML 处理器进行强化,包括超过两倍的功耗效率,达到 5 TOPs/W、存储器压缩技术提升达三倍,以及将新一代性能提升至最多可达八核、最高可达 32 TOP/s。

1  ARM V8 不受清单限制

针对美国实体清单对于华为的限制,此前 Arm 全球负责芯片授权的 IP 产品事业群总裁热内·哈斯(Rene Haas)曾明确表示,华为和海思是 Arm 的长期合作伙伴,后续的芯片架构都可以授权给华为海思。
目前,美国尚未将华为从实体清单中移除,但全球各家科技企业已纷纷宣布将继续与华为合作。
在今天的活动上,ARM 中国 CEO 吴雄昂补充表示,经过法务严格的合规调查 Armv8以及未来的v9架构源于英国,可以继续向所有中国客户开放授权。
Arm 于 2011 年发布 V8 架构,并在此架构的基础上发布了 Cortex A76、Cortex-A77 等芯片核,华为等芯片设计企业再在这些芯片核的基础上,设计出最终的手机芯片。
根据最新的数据显示,Arm 在中国的合作伙伴已经超过 200 家,中国合作伙伴出货的基于 ARM 架构的芯片已超过了 160 亿颗,国产 SoC 芯片 95% 都是基于 ARM 架构的。吴雄昂强调,ARM 是唯一非源于美国的主流计算架构。

2  全面运算(Total Compute)时代到来!


在今年的国际计算机展 (COMPUTEX 2019) 上,Arm 院士、副总裁暨机器学习事业部总经理 Jem Davies 说明了 Arm 对 ML 市场发展的看法和策略,强调 Arm 是市场上唯一拥有广泛 CPU、GPU 和 NPU 产品组合的供应商,以及强大的生态系统支持。
藉由采用全面运算 (Total Compute) 方式,Arm 将能够提供最佳的集成解决方案,以因应现今的挑战并实现 ML 应用的庞大潜能。
而在本月 Arm TechCon 2019 活动上,Arm 宣布与 Unity 合作,以确保 3D 应用程序在使用 Arm 架构的硬件上流畅运行,作为全面计算(Total Compute)协作方法的一部分,开发人员可以轻松访问除 CPU 内核之外的其他内核。
Arm 方面认为,Arm Total Compute 代表了一种 IP 设计的新方法,重点是用例驱动的优化系统解决方案。
基于该解决方案,开发人员将借助软件开发套件编写他们的软件,从而可以找出在 CPU、GPU 或机器学习(ML)硬件上处理该软件的最佳方法,了解如何优化以获得最佳渲染和性能。Arm 的客户小组副总裁 Paul Williamson 表示,这取决于在给定的功率范围内处理软件的最佳方法。
作为 Total Compute 的一部分,Arm 和 Unity Technologies 正在扩展战略合作伙伴关系,以进一步提高性能。
可以预见的是,无论是用于 VR 头显还是可穿戴设备,智能手机或 DTV,Total Compute 都将扮演重要的作用,采用全面计算方法,简化安全性,提高性能和效率,并为开发人员提供整个 Arm 生态系统更多的性能访问机会,最终实现真正的数字沉浸式体验。

3  下一代押宝机器学习


ARM 还宣布在未来更新一代的 Matterhorn CPU,Matterhorn 是下一代 Cortex-A 内核的代号。
Arm 首席执行官 Simon Segars 曾介绍,Matterhorn 中添加了 Matrix Multiply(MatMul)通用矩阵乘,从而使其机器学习性能比 Cortex-A77 提高了一倍。
 Arm 还将在整个 CPU 内核和缓存中添加新的安全措施。这些安全扩展将能够控制指针授权,并提供分支目标标识符和内存标记扩展。Arm 计划提供另一种符合这些新功能的平台安全架构(PSA)EL2。
自 Arm 推出 Cortex-A73 以来,Arm 逐步提高了机器学习(ML)的性能,希望大幅扩展机器学习在 CPU 中的使用。

4  扩展边缘算力,强调安全需求


Arm 发布 Cassini 计划,通过多元化和安全的边缘生态系统确保云原生计算的体验,包括开放平台标准和参考系统设计,以及云生态软件堆栈,用于边缘安全基础架构设计的 PSA 架构。
Arm 方面认为,利用 AI 边缘的应用程序的成功部署,关键在于提供能够覆盖各种功耗与性能需求的多元解决方案。单一厂商的解决方案,并无法满足所有需求。除了变成以 AI 为中心,AI 边缘必须是云端原生的、虚拟化 (VM 或 containers) 的,同时支持多用户。最重要的是,它必须是安全的。
目前构成基础架构边缘的解决方案来自一个极度多元化的生态系统,而这个生态系统也在迅速变革,以满足这些新产生的需求。
为了应对 AI 边缘的变革,Arm 宣布推出 Project Cassini:这是一个专注于在多元与安全的边缘生态系统,确保云端原生体验的业界提案。
Project Cassini 将专注于基础设施边缘,开发平台标准与参考系统,并以它们为基础,在目前已延展到基础设施边缘的标准化平台安全架构 (PSA) 框架内,无缝部署云端原生的软件堆栈。
两年前 Arm 推出 PSA,让企业得以依据一套通用的需求设计安全功能,以降低打造产品级 IoT 安全性相关的成本、时间与风险。现在,Project Cassini 将 PSA 延展至基础设施边缘,目标是让所有最基本的安全需求标准化。
产业CPU机器学习智能芯片算力ARM
暂无评论
暂无评论~