近日,英特尔旗下的 Habana Labs 重磅宣布,其 AI 训练和推理加速器将为加州大学圣地亚哥分校(UCSD)圣地亚哥超级计算机中心(SDSC)的 Voyager 超级计算机提供高性能的 AI 计算能力,并计划于 2021 年秋季投入使用。 Voyager 超级计算机将致力于推进跨学科和工程领域的人工智能研究。该系统由美国国家科学基金(National Science Foundation)拨款资助,同时也将面向社会应用和运营需要。SDSC 于 2020 年 7 月宣布该计划。
Habana Labs 成立于 2016 年,是一家领先的 AI 处理器公司,致力于开发专为优化深度神经网络训练 和在生产运营环境中进行推理部署的处理器平台。作为一家服务于各大数据中心、专注于深度学习加速器开发的领导者,Habana Labs 通过提高处理性能和可扩展性、降低成本和功耗来提升整个平台的价值,最大化释放人工智能的巨大潜力。2019 年,Habana Labs 被英特尔收购,成为英特尔数据产品集团独立运营的业务部门。
虽然成立时间不长,但 Habana Labs 在 AI 推理和训练处理器领域已经取得了显著的成果。2018 年 9 月,Habana 推出 Goya 人工智能推理芯片 Goya。就其性能而言,在 ResNet-50 模型上,Goya 四倍于英伟达 Tesla T4 的处理性能,两倍的能耗比。Goya 芯片已拥有很多客户。2019 年 6 月,Habana Labs 发布了人工智能训练芯片 Gaudi,它采用台积电 16 nm 制程。在 ResNet-50 模型的训练中,其每秒可以处理 1650 张图片。在完整服务器系统条件下的对比中,同为 650 个处理器,Gaudi 的处理能力是英伟达 Tesla V100 的 3.8 倍。
项目细节
据介绍,此次 SDSC 的 Voyager 超级计算机采用了 Habana 独特的互联技术,使用 336 片 Gaudi 加速器有效地提升了 AI 训练能 力,这种架构很好地扩展了大型超级计算机的训练应用。作为目前业界唯一内置集成 10 个支持 RoCE v2 100G 以太网端口的 AI 处理器,GAUDI 可以有效提升扩展的灵活性,避免扩展能力受限于吞吐量。Voyager 系统还采用了 16 片 Habana Goya 处理器用于 AI 推理模型。2021 年 10 月超算集群将首先向研究人员开放。
与此同时,超微是 Voyager 项目的技术合作伙伴,也是企业级计算、存储、网络解决方案和绿色计算技术等领域的全球领导者,将为 Voyager 超级计算机提供基于 Habana 的 AI 系统。
一方面,超微 X12 Gaudi AI 训练系统(SYS-420GH-TNGR)内置 8 个 Gaudi HL-205 卡,搭配英特尔在本周推出的高性能双路第三代至强可扩展处理器。另一方面,超微 SuperServer 4029GP-T 内置 8 片用于 AI 推理的 Habana Goya HL-100 PCIe 卡,搭配双路第二代英特尔至强可扩展处理器。本地客户现在可以使用作为解决方案。
超微技术与业务支持副总裁 Ray Pang 指出:「将超微领先的应用优化服务器和存储硬件与 Habana AI 训练和推理产品相结合,将为 SDSC 持续的 Voyager AI 研究项目提供最佳解决方案。」他还表示:「我们将继续与领先的技术创新者紧密合作,为全球科学和医学发现、计算和领先的边缘 AI 提供计 算密集型项目解决方案。」
GAUDI 和 GOYA 能为 Voyager 项目带来什么
SDSC 数据科学计算部门负责人兼 Voyager 项目首席研究员 Amitava Majumdar 指出:「Habana 针对深度学习和 AI 工作量的创新优化解决方案,成为 Voyager 即将进行的 AI 研究的理想选择。我们期待与 Habana、英特尔以及 Supermicro 合作,将这种独特高效的计算能力引入 Voyager 项目,让学术研究 人员能够使用一个当今最强的人工智能系统。」
Habana Gaudi AI 训练处理器和 Goya AI 推理处理器的设计旨在提升 AI 工作的性能和效率。他们将为数据科学家和研究人员提供访问 Voyager 的灵活性,使他们能够使用可编程张量处理器内核和内核库定制模型,并使用 Habana 的 SynapseAI 软件平台简化实现,该平台支持流行的机器学习框架和 vision,以及自然语言处理和推荐系统等应用的 AI 模型。
Habana 的 Gaudi 和 Goya AI 产品以其高效率和高性能有效地解决了 SDSC 等顶级学术机构日益增长的 AI 研究工作需求。
Voyager 开始投入运营的前三年是试验阶段,在此期间,SDSC 将与天文学、气候科学、化学、粒子物理学和其它领域的一流研究团队合作,利用 Voyager 的独特特性获取更多 AI 领域的经验和见解。在整个测试阶段,SDSC 将与 AI 研究计算团队分享经验,并共同撰写 AI 文档,作为第四、五年中扩大用户群的资源。
Habana Labs 首席商务官 Eitan Medina 表示:「我们很荣幸能为 SDSC 的 Voyager 超级计算机提供高效的 AI 解决方案。」
英特尔副总裁兼高性能计算事业部总经理 Trish Damkroger 表示:「Voyager 对性能与效率的高水准要 求正是英特尔架构的设计目标。英特尔至强可扩展处理器与 Habana AI 加速器相结合,将确保 Voyager 用户在开创性的科学研究中拥有 HPC 和 AI 能力。」
最后,就大家非常关注的 GAUDI2 芯片发布时间,Habana Labs 中国区总经理于明扬先生表示,采用台积电 7nm 制程工艺的 GAUDI2 大概将于 2022 年上半年推出。与上一代相比,GAUDI2 将实现绝对性能两倍提升,包括对典型模型的支持以及更好的软件生态和框架支持。新型模型的匹配、更好的供应链以及预处理等更多新的功能,从而减少 CPU 资源消耗。
参考链接:
https://zhuanlan.zhihu.com/p/70098260
https://www.jiqizhixin.com/articles/2019-12-17-3