Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

蛋酱报道

AI大变革时代,这家中国企业如何走在全球算力市场的前列?

一场关于算力的角逐,正在变得更加激烈。

随着深度学习的兴起,再加上 2022 年底 ChatGPT 的爆火以及同类产品的涌现,不管是学界还是业界,对于作为人工智能技术进步三大要素之一的算力的需求,都呈现持续攀升的趋势。

对于一家在算力基础设施层面布局多年的公司来说,这可能是最好的时代。

在这种趋势的推动下,联想集团基础设施方案业务创下了历史纪录:2022/23 财年第三财季,ISG 实现营收 203 亿人民币,同比提升 48%,连续第三个季度创历史新高。联想集团的基础设施方案业务提供的,正是 ChatGPT 这样的 AI 应用所需的算力。

Gartner的分析机构数据显示,据预测到 2025 年,全球服务器市场规模将达到 1350 亿美元,边缘计算设备市场将达到 370 亿美元,而存储设备市场将突破 350 亿美元。随着云计算市场的进一步细分,行业云将成为云计算领域的下一个主场,到 2027 年,超过 50% 的企业将使用行业云平台来加速其业务计划。联想集团的 ISG 基础设施解决方案业务,也将继续受益于全球 ICT 基础设施升级的步伐。

图片

Kirk Skaugen

联想集团执行副总裁、基础设施方案业务集团(ISG)总裁 Kirk Skaugen 表示:「高速增长的原因首先是市场需求明显上升,其次是越来越多的客户开始意识到联想不仅是一家 PC 公司,更是一家服务和解决方案提供商。」

此外,在高性能计算的布局上,联想集团的成果同样引人注目。近年来,这家公司的超级计算机制造数量始终呈稳定增长趋势,成为了 Top500 榜单上的常客。在 TOP 500 高性能计算机系统中,超过三分之一由联想集团提供。从各个供应商的性能份额上看,联想集团也排在全球第三的位置。

图片

在 2022 年 11 月发布的最新一期 Top 500 高性能计算榜单中,联想集团以 161 台的制造数量稳居全球超级计算机供应商第一位,市占率为 32%。

翻开近年的高性能计算排行榜,我们可以充分感受到两点,一是浮点运算次数的纪录不断被刷新,二是来自中国的科技企业已经成为了重要的参与者。

两周前,当机器之心抵达慕尼黑、巴塞罗那两地的高性能计算中心和联想集团匈牙利工厂时,这些感受变得更加直观。

更强大的计算,更前沿的探索

经历数年的发展,联想集团的高性能计算解决方案业务已经获得了许多知名研究机构和大学的合作,并推动解决人类一些最大挑战的研究。莱布尼茨高性能计算中心和巴塞罗那高性能计算中心就是两个极具代表性的合作案例。

莱布尼茨高性能计算中心(LRZ)位于德国「工业重镇」慕尼黑,是欧洲最著名、最大的高性能计算中心之一。

这所高性能计算中心成立于 1962 年,迄今已有 51 年的历史。在 2022 年 11 月的 TOP 500 高性能计算榜单中,LRZ 位列第 29 名。

图片

图片

图源:https://www.top500.org/lists/top500/list/2022/11/

SuperMUC-NG 是 LRZ 目前的主要机型,由联想集团和英特尔合作交付。相比上一代 SuperMUC,SuperMUC-NG 的计算能力实现了大幅提升,峰值运算可达 26.7 petaflops,主存储达到 719TB。

走进 LRZ 机房,人们就可以看到 SuperMUC-NG。这些巨型机器均带有红色的「Lenovo」标识,正在高速运算。

图片

基于这台超级计算设备,目前已有近 1300 位科学家在近 500 个不同领域的项目上运用运算功能。

跟随中心负责人的讲解,我们得以进一步了解 LRZ 的发展历程。

深度学习时代来临之后,研究人员越来越多地使用人工智能方法进行更深入的数据分析,大型科研项目所需要的算力已经不可同日而语。对于单个机构运营来说,部署高性能计算的设备和技术首先是成本太高,同时也太复杂。而 LRZ 能够以一种简单的方式向这些机构提供一站式服务,从最简单的访问数据信息、快速处理和分析数据,再到高科技科研领域。

LRZ 目前向整个欧洲大陆的科学、研究及学术界专业人士提供高性能计算资源,其客户群体非常广泛:LRZ 最大的两个客户是慕尼黑工业大学和慕尼黑大学(慕尼黑应用技术大学)的高性能计算服务,也会为慕尼黑以及巴伐利亚州的其他大学提供服务和支持。同时,LRZ 还为欧洲的科学家们提供高性能计算支持,尤其是在欧洲高级计算合作伙伴计划(PRACE)内的机构和教授。

一直以来,LRZ 都在向客户提供横跨天体物理、流体力学、生命科学等各种复杂领域的科学研究支持。例如,LRZ 曾经完成了世界上最大的地震及由此引发的海啸的模拟,包括苏门答腊地震等,该研究能够实现实时情景规划,有助于预测余震和其他地震灾害。

自 2021 年起,联想集团已经与 LRZ 展开第二阶段合作。总体来说,SuperMUC-NG 第二阶段的计算节点性能可达到第一阶段的四倍。过去需要 16 个小时的地震重建问题,目前在 LRZ 只需要 55 秒就能完成计算。

通过高速网络和分布式异步对象存储(DAOS 系统)连接,SuperMUC-NG 第二阶段的数据存储容量达到 1PB。世界上最大的「宇宙湍流模拟」就是在 SuperMUC-NG 第二阶段的超级计算机上运行的。

这种对「更强计算」的极致追求,在巴塞罗那高性能计算中心(BSC)的观访中也能感受到。

与众不同的是,这一座高性能计算中心是建在巴塞罗那郊区的 Chapel Torre Girona 教堂之内。尽管 BSC 本身的历史算不上悠久,但它所处的这栋教堂却来自遥远的 19 世纪。

穿过长长的走廊,就可以来到教堂内部的机房,阳光透过彩绘玻璃,形成柔和的光影。科技与艺术的美感交织于一体,这里也因此被称为「世界最美超算中心」。

图片

在 2022 年 11 月更新的高性能计算 TOP 500 榜单中,巴塞罗那高性能计算中心排第 88 位。

巴塞罗那高性能计算中心主要的机型名为「MareNostrum」。2017 年,联想集团与 IBM 携手,为巴塞罗那高性能计算中心交付了 MareNostrum 4。相比 2012 年至 2013 年安装的 MareNostrum 3 ,MareNostrum 4 快了十倍,但耗能仅增加了 30%。

MareNostrum 4 由 48 个机架组成,共计 3456 个联想 ThinkSystem SD530 节点,每个节点每秒执行超过 3.2 万亿次计算,总集群性能为 11.15 Petaflops(1.11 亿亿次),为客户在基因组测序、语言学、地球物理学和制药等多种领域的研究提供了有力支持。

图片

目前,联想集团已开始进行 MareNostrum 5 高性能计算机通用集群的安装,整体将于 2023 年中期完成。该集群的性能将超过 35 Petaflops,这意味 MareNostrum 5 的计算能力会是 MareNostrum 4 的数倍,它将成为世界上最强大的高性能计算机之一。

能耗大幅降低,为什么「海神温水水冷」能做到?

高性能计算中心能够提供更强的算力,帮助研究者处理普通计算机应付不了的难题。同时,能耗问题也是高性能计算中心想要实现可持续发展过程中必须面对的一项挑战。 

曾经,水冷是一种相比风冷成本更高的制冷技术,应用范围较小。但随着 AI、云计算等技术的大规模应用,传统风冷技术已无法满足其散热需求,而水冷省去了空调、服务器风扇等高能耗设备,成为了更加高效、更稳定的散热方式。

在上述两家高性能计算中心的观访中,关于「能耗」的数字让人印象格外深刻,温水水冷技术是一大亮点。

借助联想集团自主研发的海神(Neptune™)温水水冷技术解决方案,莱布尼茨高性能计算中心可以根据不同客户的业务需要,实现温水液冷 + 热能回收,综合降低和算力无关的电力消耗,创造能源的循环再利用。该温水水冷技术可以去除计算系统中约 90% 的热量,相较于传统的风冷技术节能 35%,节省下来的能源可以为 4700 个德国家庭供电一年。

「海神」温水水冷方案会将热量从 CPU、GPU、存储等和核心发热部件直接排出系统,比传统的空气散热更高效、更便宜,相比于其他水冷技术也独具优势。

「在一般的水冷技术中,冷却过程总是会有一些蒸汽的消耗,还需要从市政的水里进行水总量的补充,而联想集团采用了温水水冷方案,这意味着可以在自身的封闭系统内循环,水量不会减少。」 Kirk Skaugen 表示:「温水水冷技术的优势就在于,不需要在天台上准备很多的设备去降温,每个单独的单元都可以自行降温,以此降低能耗。」

温水水冷技术可以实现热回收,让高性能计算废热产生的 60° 中高质量的热水用于楼宇供暖,泳池加热等场景。比如,SuperMUC-NG 的余热能在冬季为办公室保暖,让该解决方案的能源效率得到了进一步提高。 

将「中国工厂」复制到欧洲

在了解高性能计算的进步之后,人们还可能关心一个问题:这些计算机是在哪里生产制造的?

实际上以 SuperMUC-NG 第二阶段为例,它的配件并非完全来自中国,很多都是由几百公里外的联想集团匈牙利工厂生产的。

图片

2022 年 6 月,联想集团匈牙利工厂全线投产,从启动到建成,只用了 10 个月。这也是联想集团在欧洲的首个自有生产基地,主要为 EMEA 地区的客户提供服务器基础设施、存储系统和高端 PC 工作站。目前,联想集团 EMEA 地区 90% 的数据中心产品以及该地区约 50% 的 Think 台式机和工作站产品都是从这个工厂产出的。

「我们的很多产品都是定制化的,有时候客户的订单需求会很急,在匈牙利成立工厂能够保证我们快速反应,一旦产品被生产出来,通过卡车仅需两天左右就可以把它运到欧洲的任何一个国家。」联想集团全球供应链匈牙利地区负责人兼匈牙利工厂厂长 Szabolcs Zolyomi 表示。

工厂内部的大部分部件来自中国,也有一部分来自欧洲,还有一些包装、机架、机柜则来自匈牙利本地的供应商。

图片

在这家匈牙利工厂的产线,平均每分钟下线一台服务器,15 秒下线一台工作站,每天可以生产超过 1000 个定制服务器和多达 4000 个定制工作站。这是联想集团「全球资源,本地交付」模式的体现,也是「中国工厂」复制到海外的一个样本。

Szabolcs 表示,未来三年的数据增长规模可能是前所未有的,对算力也会产生更多的需求。「所以我们很有信心,未来工厂的产能会有很大的增长。不管是别的品类,还是服务器本身的产能,可能都会有明显提升。」

大多数人都认同,我们正在从「信息时代」过渡到「算力时代」,越来越多的行业需要算力,并以此实现自身的技术革新。

对于联想集团这样的算力基础设施服务提供者而言,AI 大变革既是挑战也是机遇。这家中国企业已经走在了全球算力市场的前列,而「算力」亦将成为其在新时代最重要的业务引擎之一。

产业联想
暂无评论
暂无评论~