Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

蛋酱、小舟报道

性能是A100 2.4倍,AMD官宣两款HPC新品,还拿下了Meta

AMD 宣布将在 2022 年初推出带有 AMD 3D V-Cache 的第三代 EPYC 处理器和 Instinct MI200 系列 GPU 加速器。

几年来,AMD 一直在行业内稳步前进。一方面,它在消费芯片市场与传统竞争对手英特尔、英伟达竞争;另一方面,AMD 正在努力重新进入处理器行业的关键领域:服务器市场。

随着创建和生成的数据越来越多,对能够分析海量数据并从中做出推断的高性能计算平台的需求呈指数增长。现在,AMD 宣布将在 2022 年初推出带有 AMD 3D V-Cache 的第三代 EPYC 处理器和 Instinct MI200 系列 GPU 加速器,旨在使用领先的内存和互连技术满足这些需求,这些技术将为 AMD 的数据中心产品和平台带来显著的性能改进。

搭载 AMD 3D V-Cache 的第三代 EPYC 处理器

几个月前,AMD 透露其消费级锐龙处理器将采用 3D V-Cache 技术。3D V-Cache 本质上是在台积电 7nm 节点上制造的 64MB SRAM 缓存,它直接连接在基于 Zen3 的处理器中每个 CCD 的顶部,将处理器内核可用的高速 L3 缓存量有效地增加了三倍。额外的缓存使用 TSV 直接与 CCD 相连,没有任何焊接凸点(soldered bump)。现在,AMD 的 EPYC 服务器处理器也将拥有这些优势。

带有 AMD 3D V-Cache 的第三代 AMD EPYC 处理器。

为了将 3D V-Cache 引入 EPYC,AMD 与台积电合作,将缓存裸晶(die)减薄并添加必要的硅结构,将缓存和计算 die 粘合成一个无缝表面。组装好的 3D 堆叠芯片具有与 AMD 标准处理器芯片相似的外形,具有 3D V-cache 的第三代 EPYC 处理器与现有平台和插槽引脚兼容。

在计算能力方面,具有 3D V-Cache 的第三代 EPYC 处理器与现有的 EPYC 处理器相似。它们将提供多达 64 个内核(128 个线程),但具有 3D V-Cache 的新处理器能提供高达 3 倍的 L3 缓存。具有 3D V-cache 的第三代 EPYC 处理器每个插槽将具有高达 804MB 的总缓存,这比现有的 EPYC 处理器(最高为 256MB)有了巨大的提升。基于此,AMD 声称在某些 HPC 工作负载中性能可以提高 50%。

带有 AMD 3D V-Cache 的第三代 AMD EPYC 的性能。

与竞品相比,AMD 声称在 Ansys 机械有限元分析工作负载中,双插槽 32 核 2P EYPC 75F3 系统优于 32 核 2P Xeon 8362 系统高达 33%。在由 Altair Radioss 进行的 Structural 分析测试中该优势高达 34%,在 Ansys CFX 流体动力学分析中高达 40%。

Instinct MI200:首款 6nm 多芯片封装 GPU

除了配备 3DV 的第三代 EPYC 处理器外,AMD 还推出了迄今为止最强大的 GPU 加速器「AMD Instinct MI200 系列」。与基于 RDNA 2 架构、面向消费者的 Radeon 系列 GPU 不同,AMD Instinct 加速器采用 CDNA 2 架构,它专为高性能标量和矢量处理工作负载设计,并结合了新的矩阵核心引擎。

AMD 表示,面向数据中心的最新 GPU 的高性能计算 (HPC) 速度将提高 9.5 倍,AI 工作负载的速度将比竞品 GPU 快 1.2 倍(例如英伟达 GPU)。Instinct MI200 是专为数据中心设计的一系列 GPU 中的最新款,而非面向游戏和桌面图形处理。

对于此次更新,AMD 特别专注于提升双精度浮点运算的性能,这就是为什么声称 HPC 的性能改进大于 AI 处理的原因。AMD 数据中心 GPU 加速器企业副总裁 Brad McCreadie 表示:「我们的目标是让这款设备在需要双精度运算的最棘手的科学问题上做到非常好,这就是我们向前迈出的最大一步。」

AMD Instinct MI200.
 
AMD Instinct MI200 系列 GPU 加速器采用双芯片设计,由大约 580 亿个晶体管(6nm 制造)组成。MI200 将拥有多达 14080 个流处理器,组装为 220 个 CU(计算单元),具有多达 880 个第二代矩阵内核,搭配高达 128GB(8 堆栈)的 1.6GHz HBM2E 显存,通过 8192 位的接口,实现 3.2 TB/s 的峰值内存带宽。MI200 系列还包含多达 8 个第三代 Infinity Fabric 链路,在 Instinct MI200 GPU 加速器和 EPYC 处理器之间提供高带宽连接。

AMD Instinct MI200 系列的特性和技术。
 
为了构建这些双芯片 GPU 加速器,AMD 正在使用一种新的封装技术,名为「2.5D Elevated Fanout Bridge(EFB)」。EFB 是一种超高带宽芯片互连方法,可用于标准基板和倒装芯片制造处理器,与同类的多芯片互连解决方案相比,其成本和复杂性较低。

Instinct MI250X 将位于 AMD 高性能计算 GPU 堆栈的顶部,并具有完整的 220 CU 和 128GB 的 HBM2E 配置,还会有一个「标准」的 MI250 模型,它在某种程度上减少了 208 个 CU,总共有 13312 个流处理器,但具备相同的内存配置。

AMD Instinct MI200 vs. NVIDIA A100.

在性能方面,AMD 本次的发布内容依旧令人印象深刻。在一系列 HPC 基准测试中,将 AMD Instinct MI200 OAM 模块与 NVIDIA 的 A100 SXM 进行对比,MI200 提供了 2.2 到 3 倍的计算性能。在一系列 HPC 应用中,AMD 发布了类似的内容,MI200 比 A100 具有 1.4 到 2.4 倍的算力优势。

同时,AMD 宣布了 Facebook 母公司 Meta 数据中心将使用 AMD 生产的芯片。消息公布后,AMD 股价创历史新高,上涨 12% 以上,市值突破 1800 亿美元。

上个月,苏妈表示,最近一个季度,AMD 数据中心芯片的销售额同比增长了一倍,占 AMD 销售额的 20%。数据中心芯片是 AMD 嵌入式、企业级和半定制业务的一部分,该业务上一季度的销售额为 19 亿美元,同比增长 69%。

AMD 的 Instinct MI200 系列加速器将利用开放式硬件计算加速器模块(或 OAM)外形,不过 MI240 也将作为现有服务器的 PCIe 附加卡提供。AMD Instinct MI200 系列 GPU 加速器和具有 3D V-Cache 的第三代 EPYC 处理器都将于 2022 年第一季度上市。

参考链接:https://www.forbes.com/sites/marcochiappetta/2021/11/08/amd-unveils-epyc-with-3d-v-cache-and-powerful-instinct-mi200-accelerators-for-exascale-supercomputers/?ss=ai&sh=46e730e02529
产业Instinct MI200系列GPU加速器。第三代EPYC处理器AMD
相关数据
基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

堆叠技术

堆叠泛化是一种用于最小化一个或多个泛化器的泛化误差率的方法。它通过推导泛化器相对于所提供的学习集的偏差来发挥其作用。这个推导的过程包括:在第二层中将第一层的原始泛化器对部分学习集的猜测进行泛化,以及尝试对学习集的剩余部分进行猜测,并且输出正确的结果。当与多个泛化器一起使用时,堆叠泛化可以被看作是一个交叉验证的复杂版本,利用比交叉验证更为复杂的策略来组合各个泛化器。当与单个泛化器一起使用时,堆叠泛化是一种用于估计(然后纠正)泛化器的错误的方法,该泛化器已经在特定学习集上进行了训练并被询问了特定问题。

AMD机构

超威半导体(中国)有限公司专门为计算机、通信和消费电子行业设计和制造各种创新的微处理器(CPU、GPU、主板芯片组、电视卡芯片等),以及提供闪存和低功率处理器解决方案,公司成立于1969年。AMD致力为技术用户——从企业、政府机构到个人消费者——提供基于标准的、以客户为中心的解决方案。

https://www.amd.com/zh-hans
推荐文章
暂无评论
暂无评论~