李泽南 李亚洲参与

华为麒麟980:双核NPU,全球首款7nm手机芯片正式发布

去年,华为发布的全球首款 AI 手机芯片麒麟 970 让世人惊艳。刚刚,在德国 IFA 2018 展会上,余承东发布了它的继任者:第二代 AI 芯片麒麟 980。这款芯片采用 7nm 工艺,搭载业内首款双核 NPU,将旗舰手机 CPU 的水平再次提升到了一个新高度。(注:文中图片大多来自「华为终端公司」微博账号)

在发布会上,华为表示:作为全球第一块消费级 7nm 制程工艺芯片,麒麟 980 相较前代 10nm 的工艺在性能上提升 20%,能效提升 40%,晶体管密度提升了 1.6 倍。

此外,华为还宣称麒麟 980 实现了几项世界第一:

  • 全球最早商用 7nm 工艺的手机 SoC 芯片

  • 全球首款 ARM Cortex-A76 商用 CPU 的芯片

  • 全球首款搭载双核 NPU 的手机芯片

  • 最先采用 Mali-G76 GPU 的手机芯片

  • 全球最先支持 LTE Cat.21 的芯片,峰值下载速率 1.4Gbps,达到业内最高

  • 支持全球最快的 LPDDR4X 内存颗粒,主频可达 2133MHz,业内最高

有关麒麟 980 的发布消息,这几个月来一直传闻不断,但其中最具可信度的还是荣耀在 8 月 30 日的「官方泄露」。在 IFA 2018 大会开始前一天,荣耀手机就在柏林举办了一场发布会,荣耀 CEO 赵明公布了采用新一代的 AI 芯片的第一款手机——荣耀 Magic2。

而关于麒麟 980 具体规格的更多细节,余承东在刚刚的 Keynote 中为我们一一揭晓。

麒麟 980 芯片

首先,上台后的余承东回顾了去年的 IFA,以及去年发布的麒麟 970,这是华为迈向设备上 AI 的第一步。一年后,大众所期待的麒麟 980 最终发布。从下图来看,华为表示麒麟 980 是当前最强大、最智能的手机端 AI 芯片。

2+2+4 的 CPU 形式

麒麟 980 的 CPU 核心部分采用了新一代的 ARM CPU 架构 Cortex-A76,ARM 曾表示,相比于采用 10nm 制程的 Cortex-A75(骁龙 845 搭载的内核型号),采用 7nm 制程的 A76 性能提升 35%、能效提升 40%,机器学习速度则可以提升四倍。

本次华为与众不同地采用了 2+2+4 的大中小核形式,其中两个频率为 2.6GHz 的 A76 大核负责高负载任务,两个频率 1.92GHz 的 A76「中核」负责日常任务。四个 A76 大核之外,还有四个 A55 小核(1.8GHz)负责轻度运算。值得一提的是,相比前几代的公版设计,麒麟 980 的 CPU 部分采用了半定制架构,可见华为海思已经在充分利用 ARM 的新 DSU 集群以及异步 CPU 配置了。

可以看到,性能最高的 Cortex-A76 核心速度(2.6GHz)并未被设定为 ARM 公布的最高数字 3GHz,华为的保守设置或许是考虑到了功耗的限制。中等核心或许可以有效降低 SoC 整体功耗——此前,四个大核运行在相同的时钟和电压上,如果存在一个高性能线程,其他中等性能线程只能被迫作不必要的运算,降低了效率。

而相比于去年发布的麒麟 970,采用了 Cortex-A76 架构之后,麒麟 980 性能有 75% 的提升,能效有 58% 的提升。

补齐 GPU 短板

在 GPU 方面,这次麒麟 980 采用了 Mali G76,这是 ARM 重新设计架构后的新款高端 GPU,它有 4 到 20 个 shader core,其纹理单元、渲染单元、计算单元管道位宽均大幅增加,为复杂图形和机器学习的工作负载提供显著的提升。华为宣称,新 GPU 相比前代性能提高了 76%,这可以说弥补了华为一直以来 GPU 的短板。

即使是在纸面上,G76MP10 看起来要比麒麟 970 采用的 G72MP12 小,但它实际的计算资源增加了 66%——这还是在没有考虑新 IP 的微架构改进的情况下。

麒麟 980 的 GPU 工作频率为 720MHz,相较 970 的 747MHz 要慢。这种变化让新款产品能耗更低,但这并不影响新一代 GPU 性能的大幅提升。

华为对比了麒麟 980 与骁龙 845 的游戏帧率和能耗效率。

在网络方面,麒麟 980 率先支持 LTE Cat.21,峰值下载速率 1.4Gbps,但遗憾的是仍然不支持下一代 5G 网络。同时,这款芯片也支持 2133MHz LPDDR4X 的内存。

双核 NPU

去年,华为发布麒麟 970 的时候首次为手机端 SoC 引入了神经网络加速芯片 NPU。在麒麟 980 中,华为再次引入了业内首款双核 NPU,NPU 核心采用了寒武纪 1H,实现每分钟图像识别 4500 张,支持人脸识别、物体识别、物体检测等 AI 场景。

麒麟 980 上的神经网络仍然一次只能处理一个深度学习负载,不过理论运行速度加倍了。余承东表示,新的 NPU 处理单元速度要比麒麟 970 上的快 2.2 倍。

下图对比了麒麟 980 与骁龙 845、苹果 A11 在图像识别性能上的表现。

在这一切之下,我们看到了来自台积电 7nm 制程带来的提升:新款芯片在不到 100m2 的面积上堆积了 69 亿个晶体管,相比去年麒麟 970 的 55 亿个增长了 25%。

人类在芯片制程上的推进已经逐渐变得困难,台积电于 2015 年开始研发 7nm 工艺,直至今年夏天才得以正式投产。目前全球掌握 7nm 工艺的厂商只有三家:英特尔、三星和台积电。

麒麟 980 凭以上特性,打破了多个世界第一。

在展示了新产品诸多性能优势后,华为还不忘把麒麟 980 和骁龙 845 做了一个全面对比。

海外媒体 AnandTech 也于第一时间整理了麒麟 980 的主要性能参数

除了昨天已经发布的荣耀 Magic2 以外,余承东也宣布,麒麟 980 将搭载于华为即将发布的旗舰手机 Mate20 系列中——Mate 20 即将于今年 10 月 16 日在英国伦敦发布。由于昨天赵明曾表示其发布的荣耀 Magic2 可能还不是最终版本,因此目前看来 Mate 20 仍然会是麒麟 980 的首发手机。

一个多月之后,我们就能感受到新世代 CPU 处理器的强大动力了。

延伸阅读:

产业寒武纪华为NPU硬件
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

推荐文章
暂无评论
暂无评论~