AMD 全新发布 Epyc(霄龙)7003 系列处理器,代号「米兰」。该处理器基于 Zen 3 内核和 AMD Infinity 架构打造,每核心最多可达 32 MB 的 L3 缓存,相比二代处理器「罗马」,实现了 19% 的 IPC 提升。
当地时间周一,AMD 发布了全新的 Epyc(霄龙)7003 系列处理器,代号「米兰」(Milan),搭载了去年 10 月发布的全新 Zen 3 架构。Epyc「米兰」服务器芯片的规格与 Ryzen 5000 系列 CPU 大致相同:多核心、高加速时钟频率、19% 的单核性能提升,以及相较竞争对手英特尔表现出的巨大优势。据 AMD 官网数据显示,EPYC 7003 系列处理器基于 Zen 3 内核和 AMD Infinity 架构打造,具有整套功能和特性:先进的 I/O、7nm x86 CPU 工艺技术以及片上集成安全处理器。EPYC 7003 处理器具有每核心最多可达 32 MB 的 L3 缓存,支持 4-6-8 内存通道交织从而让多 DIMM 配置具有更好的性价比,并且其互联电路和内存之间时钟同步,所有这些特性都将促进更好、更快地得到结果。据悉,AMD 发布「米兰」服务器芯片,旨在从竞争对手英特尔手中抢占更多的市场份额。与消费级 PC 和工作站相比,AMD 与英特尔在服务器芯片领域的竞争更为明显。即使在 AMD 开始主导多线程性能之后,英特尔依然在单线程方面占据领先地位。这一领先地位在 2020 年趋于消失,但英特尔依然可以拿出与 AMD 几乎相同的单线程性能,尽管在全线程性能方面遭到了碾压。据悉,AMD 已经完成该芯片的设计,并委托台积电采用 7nm 芯片制程工艺来实现量产。与 2019 年自家发布的第二代 7nm 制程 Epyc 罗马(Rome)处理器相比,AMD Epyc「米兰」完成了从 Zen 2 架构到 Zen 3 架构的过渡,并且与桌面端 Ryzen 5000 系列 CPU 相比相差不大。但与英特尔 Xeon 处理器相比,Epyc「米兰」的速度更快,且能够使用更少的物理空间和功率完成更多的工作。下图展示了 AMD Epyc 处理器与英特尔 Xeon 处理器不同的发展曲线,其中 Epyc 处理器在 2017 年实现了突飞猛进,超越了英特尔 Xeon,并在之后几年继续遥遥领先:此外我们可以看到,2017 年和 2018 年,AMD Epyc 和英特尔 Xeon Scalable 之间并没有拉开太大差距,但是 AMD 在 2019 年推出了 Zen 2 架构,实现了真正的巨大飞跃。以具体数据说话,AMD Epyc 7763 系统上运行的 VDI 桌面会话数量是英特尔 Xeon Platinum 8280 系统上的 2.12 倍:在高性能计算(HPC)和云计算工作负载方面,第三代 Zen 架构的 AMD Epyc 处理器较竞争对手英特尔双双提升了 106%:在企业工作负载方面,AMD Epyc 处理器提升了 117%。此外,即使从 64 核心的 Eypc 7763 降至 32 核心的 75F3,其性能依然较英特尔最佳性能提升了 70%。「米兰」实现了 19% 的 IPC 提升,而这主要由于其采用了全新 Zen 3 架构,该架构改进了分支预测、执行 pipeline 更宽,每时钟周期加载 / 存储操作有所增加。Zen 3 架构还提供了比 Zen 2 更统一的 L3 缓存设计。Zen 2 / Rome 为每个四核组提供 16MiB L3 缓存,而 Zen 3 / Milan 为每个八核组提供 32MiB 的 L3 缓存。虽然每核的 L3 缓存还是 4MiB,但对于多核共享数据的工作负载而言,Zen 3 这种更统一的设计可以更好地节省缓存空间。如果八核的 L3 缓存数据为 3MiB,则二代罗马处理器需要 6MiB,在每个四核组中它需要进行一次复制。而三代「米兰」处理器可以节省 3MiB 缓存,只用 3MiB 就可以服务八核,这也意味着单核可以处理更多 L3 缓存。其结果就是针对大型工作负载实现更快的内核与缓存通信,同时有效存储延迟也出现对应的降低。AMD Epyc 处理器在安全性方面的声誉要好于英特尔至强处理器。从 Epyc 罗马开始,Spectre 和 Spectre V4 攻击可以通过硬件和操作系统 / 虚拟机监视器(Hypervisor)得到缓解。而这次新发布的「米兰」处理器支持安全嵌套分页(Secure Nested Paging),即为受信任的虚拟机提供保护,使其免于不受信任的虚拟机监视器,并且米兰还提供了一个新特性——CET Shadow Stack。该特性能够提供返回地址的镜像,从而免受面向返回编程(ROP)的攻击。这使得系统能够检测和缓解攻击,即使成功实现了某个堆栈溢出攻击,但它无法攻击影子堆栈。该特性要求操作系统 / 虚拟机监视器进行软件更新。Epyc 「米兰」处理器共有 19 种型号,包括 15 款双路型和 4 款单路型,核心数从 8 核到 64 核不等(每路 16 线程到 128 线程不等),下至 8 核 72F3(3.70-4.10GHz,180W TDP),上达 64 核 7763(2.45-3.50GHz,280W TDP)。图源:https://www.amd.com/zh-hans/processors/epyc-7003-series所有的「米兰」型号均提供同时多线程(单核双线程)、8 通道 DDR4-3200 RAM、128 lane PCIe4、安全内存加密、安全加密虚拟化等。最高单核性能,这类 SKU 名称中的第三位为字母「F」,从 8 核 180W 72F3 到 32 核 280W 75F3;
针对每个 socket 的最高核 / 线程数量进行优化,名称中带有「76」或「77」,从 48C/225W 7643 到 64C/280W 7763。
其他 SKU 名称以 73、74、75 开头,旨在「平衡」,可以优化性能和 TCO。
此外,如果 SKU 名称中有「P」,则表示这是一个单 socket 模型。AMD 表示,「米兰」数据中心处理器比英特尔目前最好的数据中心芯片还要快。据了解,这款芯片由 AMD 设计,并委托台积电使用其 7 纳米芯片制程进行生产。与之相反,英特尔的一贯做法是「芯片设计与制造一体化」。但近年来英特尔的芯片制程技术略显落后。AMD「米兰」芯片及二代「罗马」芯片都超过了英特尔芯片,这帮助 AMD 抢占市场份额,比如谷歌弃用英特尔芯片,转用 AMD 数据中心处理器。AMD 高级副总裁兼服务器业务部总经理 Dan McNamara 表示,他相信只要 AMD 继续将客户反馈集成到每一代芯片中,AMD 将保持领先地位。「我们已经生产出了第三代处理器,我们认为这是针对数据中心的顶尖 CPU。如果我们继续这一步调,我们将保持高竞争力。」Dan 表示。https://arstechnica.com/gadgets/2021/03/amds-zen3-comes-to-the-server-room-with-epyc-milan/https://www.reuters.com/article/us-amd-intel/amd-launches-milan-chip-for-data-centers-as-battle-with-intel-intensifies-idUSKBN2B71VYhttps://www.amd.com/zh-hans/processors/epyc-7003-series 产业米兰(Milan)第三代Zen架构霄龙处理器AMD