![](https://image.jiqizhixin.com/uploads/editor/ea46d135-b9f3-4be6-81c5-6c5c6acbdeb7/640.png)
Arm 持续拓宽专用芯片产品线,押宝机器学习。
10 月 23 日机器之心消息,Arm 在北京举办年度技术研讨会,推出三款全新处理器 IP 设计,包括 Ethos-N57/Ethos-N37 NPUs,Mail-G57 GPU、最小面积的 Mali-D37 DPU。
三款 IP 采用 Arm AI 平台和最新的机器学习技术,面向数字电视的图形处理和显示需求,以及主流和入门级的移动设备处理。
过去一年里,Arm 推出了数个从网络终端到云端的全新解决方案,包括 Arm Project Trillium、Arm Neoverse、两个具有安全功能的全新 Automotive Enhanced 汽车强化处理器,以及专为安全管理物联网装置的 Pelion 物联网平台。Ethos 系列是专门针对 AI 计算性能提升的 NPU,Ethos-N77 将作为机器学习专用处理器,为 AI 应用程序的关键性能提供保障;Ethos-N57 和 Ethos-N37,定位于推理处理器,用于视觉、语音等适用于家庭和移动场景。此外,Arm 还发布了配套的 arm NN 开发软件。ARM Mail-G57 GPU 主要针对游戏的高能效计算需求和复杂的机器学习,能效提升了 30%,性能提升了 30%,机器学习性能提升了 60%。Mali-D37 DPU 被 Arm 定义为最小面积的 DPU,首次采用 Komeda 架构,小于 1mm²面积可提供 2K 和全高清视频,系统的功耗和内存管理需求降低了 30%。今年五月,Arm 已经推出旗舰 IP 方案,定义 2020 年高端智能手机性能,提供新一代的人工智能体验,分别包括:1)面向移动市场的 Cortex-A77 CPU;2)采用新架构满足高清游戏高性能的 Mail-G77 GPU;3)满足高清显示效果面向 VR 应用的 Mail-D77;与此同时,Arm 还通过加强与新思科技的合作促进最新高级移动处理器(包含 Arm Cortex-A77 CPU 和 Mali-G77 GPU)早期采用者流片。新思科技解决方案支持使用了 Arm 最新处理器的智能手机、笔记本电脑、其他移动设备、5G、增强现实 (AR) 和机器学习 (ML) 产品的优化设计,该解决方案包括新思科技 Fusion Design Platform、Verification Continuum 平台和 DesignWare 接口 IP。Arm Cortex-A77 CPU,拥有比 Cortex-A76 设备高出 20% 的 IPC 性能提升,可带来先进的 ML 与 AR/VR 体验。Mali-G77 GPU 利用全新的 Valhall 构架迎接这一挑战,与用在当前设备中的上一代 Mali-G76 GPU 相比,具有近 40% 的性能提升。Mali-G77 同时也在关键的微构架上进行强化,包括引擎、texture pipes 和 load store caches,并将功耗效率以及性能密度分别提升 30%。Arm ML 处理器对应的是 Project Trillium,是一个异构 ML 运算平台,包括 Arm ML 处理器以及开源的 Arm NN 软件框架,目前已搭载在超过 2.5 亿台 Android 设备上。随着机器学习使用案例的需求越来越高,开发人员也对专属神经处理器(NPU)也更为渴望。自从去年宣布推出 Project Trillium 后,Arm 已经针对 ML 处理器进行强化,包括超过两倍的功耗效率,达到 5 TOPs/W、存储器压缩技术提升达三倍,以及将新一代性能提升至最多可达八核、最高可达 32 TOP/s。针对美国实体清单对于华为的限制,此前 Arm 全球负责芯片授权的 IP 产品事业群总裁热内·哈斯(Rene Haas)曾明确表示,华为和海思是 Arm 的长期合作伙伴,后续的芯片架构都可以授权给华为海思。目前,美国尚未将华为从实体清单中移除,但全球各家科技企业已纷纷宣布将继续与华为合作。在今天的活动上,ARM 中国 CEO 吴雄昂补充表示,经过法务严格的合规调查 Armv8以及未来的v9架构源于英国,可以继续向所有中国客户开放授权。Arm 于 2011 年发布 V8 架构,并在此架构的基础上发布了 Cortex A76、Cortex-A77 等芯片核,华为等芯片设计企业再在这些芯片核的基础上,设计出最终的手机芯片。根据最新的数据显示,Arm 在中国的合作伙伴已经超过 200 家,中国合作伙伴出货的基于 ARM 架构的芯片已超过了 160 亿颗,国产 SoC 芯片 95% 都是基于 ARM 架构的。吴雄昂强调,ARM 是唯一非源于美国的主流计算架构。2 全面运算(Total Compute)时代到来!
在今年的国际计算机展 (COMPUTEX 2019) 上,Arm 院士、副总裁暨机器学习事业部总经理 Jem Davies 说明了 Arm 对 ML 市场发展的看法和策略,强调 Arm 是市场上唯一拥有广泛 CPU、GPU 和 NPU 产品组合的供应商,以及强大的生态系统支持。藉由采用全面运算 (Total Compute) 方式,Arm 将能够提供最佳的集成解决方案,以因应现今的挑战并实现 ML 应用的庞大潜能。而在本月 Arm TechCon 2019 活动上,Arm 宣布与 Unity 合作,以确保 3D 应用程序在使用 Arm 架构的硬件上流畅运行,作为全面计算(Total Compute)协作方法的一部分,开发人员可以轻松访问除 CPU 内核之外的其他内核。Arm 方面认为,Arm Total Compute 代表了一种 IP 设计的新方法,重点是用例驱动的优化系统解决方案。基于该解决方案,开发人员将借助软件开发套件编写他们的软件,从而可以找出在 CPU、GPU 或机器学习(ML)硬件上处理该软件的最佳方法,了解如何优化以获得最佳渲染和性能。Arm 的客户小组副总裁 Paul Williamson 表示,这取决于在给定的功率范围内处理软件的最佳方法。作为 Total Compute 的一部分,Arm 和 Unity Technologies 正在扩展战略合作伙伴关系,以进一步提高性能。可以预见的是,无论是用于 VR 头显还是可穿戴设备,智能手机或 DTV,Total Compute 都将扮演重要的作用,采用全面计算方法,简化安全性,提高性能和效率,并为开发人员提供整个 Arm 生态系统更多的性能访问机会,最终实现真正的数字沉浸式体验。ARM 还宣布在未来更新一代的 Matterhorn CPU,Matterhorn 是下一代 Cortex-A 内核的代号。Arm 首席执行官 Simon Segars 曾介绍,Matterhorn 中添加了 Matrix Multiply(MatMul)通用矩阵乘,从而使其机器学习性能比 Cortex-A77 提高了一倍。 Arm 还将在整个 CPU 内核和缓存中添加新的安全措施。这些安全扩展将能够控制指针授权,并提供分支目标标识符和内存标记扩展。Arm 计划提供另一种符合这些新功能的平台安全架构(PSA)EL2。自 Arm 推出 Cortex-A73 以来,Arm 逐步提高了机器学习(ML)的性能,希望大幅扩展机器学习在 CPU 中的使用。Arm 发布 Cassini 计划,通过多元化和安全的边缘生态系统确保云原生计算的体验,包括开放平台标准和参考系统设计,以及云生态软件堆栈,用于边缘安全基础架构设计的 PSA 架构。Arm 方面认为,利用 AI 边缘的应用程序的成功部署,关键在于提供能够覆盖各种功耗与性能需求的多元解决方案。单一厂商的解决方案,并无法满足所有需求。除了变成以 AI 为中心,AI 边缘必须是云端原生的、虚拟化 (VM 或 containers) 的,同时支持多用户。最重要的是,它必须是安全的。目前构成基础架构边缘的解决方案来自一个极度多元化的生态系统,而这个生态系统也在迅速变革,以满足这些新产生的需求。为了应对 AI 边缘的变革,Arm 宣布推出 Project Cassini:这是一个专注于在多元与安全的边缘生态系统,确保云端原生体验的业界提案。Project Cassini 将专注于基础设施边缘,开发平台标准与参考系统,并以它们为基础,在目前已延展到基础设施边缘的标准化平台安全架构 (PSA) 框架内,无缝部署云端原生的软件堆栈。两年前 Arm 推出 PSA,让企业得以依据一套通用的需求设计安全功能,以降低打造产品级 IoT 安全性相关的成本、时间与风险。现在,Project Cassini 将 PSA 延展至基础设施边缘,目标是让所有最基本的安全需求标准化。