2020 AWS re:Invent大会开幕,新一代机器学习定制训练芯片Trainium面世

北京时间 12 月 2 日,2020 年亚马逊 re:Invent 全球大会正式揭幕。这也是第一场以线上形式举办的 AWS re:Invent 大会,且向全球免费开放。

每一年的 re:Invent 都会有丰富的新技术和服务发布,今年也不例外。在本次长达三小时的演讲中,AWS 首席执行官 Andy Jassy 最先回顾了业务发展,并发布了 27 项创新云服务和功能(当天总共发布了 43 项新服务和功能),涵盖计算、存储、数据库数据分析、容器、机器学习运维、工业机器学习等多个方面。

在 2020 第三季度,AWS 达到年化收入 460 亿美元,同比增长 29%。「我们花了 10 年多的时间将业务规模扩大到 100 亿美元,但从 100 亿美元增长到 200 亿美元,只用了 23 个月;又过了 13 个月,这 200 亿美元增长到了 300 亿美元;14 个月后,这个数字变成了 400 亿美元。」

在 Jassy 看来,AWS 取得这项成绩的两个关键原因在于,「再造( reinvention)」与「倾听客户需求」的文化。


新一代机器学习芯片 Trainium

大会上,AWS 推出了下一代机器学习模型训练定制芯片 Trainium,该芯片支持包括 TensorFlow、 PyTorch 和 MXNet 在内的所有主流机器学习框架。它将以 EC2 实例的形式出现在亚马逊的机器学习平台 SageMaker 中,预计明年推出。

「我们想在机器学习训练方面继续提高性价比,因此必须在自己的芯片上进行投入。」

Trainium 的主要优势在于速度和成本,据 AWS 介绍,与其标准 GPU 实例相比,吞吐量将提高 30%,单次推理成本将降低 45%。

此外,AWS 正在与英特尔合作推出基于 Habana Gaudi 的 EC2 实例,用于机器学习训练。明年,这些实例相比当前基于 GPU 的机器学习 EC2 实例,成本 / 性能或许能够改善 40%。

Habana 的 Gaudi 处理器。

这些新发布的芯片将在 2021 年的 AWS 云中首次亮相,可以被视为去年 re:Invent 大会发布的「Inferentia」的补充。Inferentia 也是一款机器学习专用芯片,而且 Trainium 使用了与 Inferentia 相同的 SDK。

AWS 介绍说,虽然 Inferentia 解决了占据 ML 基础设施成本 90% 的推理成本问题,但很多开发团队仍然受限于固定 ML 训练预算的限制。「AWS Trainium 为云端机器学习训练提供了最高的性能和最低的成本,使用 Trainium 和 Inferentia,客户将获得从降低训练工作量到部署加速推理的机器学习计算端到端流程。」


多项云计算创新服务发布

2020 年虽然是充满挑战的一年,但从很多方面来说,世界将迎来一个新的十年。

新冠大流行在这一年深刻地改变了人类生活,任何规模、任何领域的企业都意识到,只有迁移到数字化平台才能维持高效运作。趋势的变化为 AWS 等公有云供应商带来了前所未有的机会。

当然,如何将业务迁移到云的问题早已经得到解决,而当前最受关注的焦点问题是:如何在云计算环境下保持业务运营?这已经成为 AWS 和各大主流云供应商关注的焦点。

在主题演讲中,Jassy 发布了多项云计算创新服务:

  • AWS Graviton 2 处理器支持的 C6gn 实例,提供了 100 Gbps 的网络性能;
  • 搭载 AMD 图形处理器(GPC)的图形优化 G4ad 实例;
  • 搭载英特尔 Xeon 最快的可扩展中央处理器(CPU)的通用型 M5zn 实例;
  • 搭载英特尔 CPU 的下一代存储优化实例 D3/D3en;
  • Amazon EC2 R5b 内存优化实例,为 Amazon EBS 弹性块存储服务提供了 3 倍于 R5 实例的性能。

据 Jassy 介绍,这些新技术将在几个月内为客户提供新的实例,而且 AWS 已经优先考虑实例、容器和无服务器应用的发展,更好地响应客户的请求。


五大用于工业领域的机器学习服务 

此外,AWS 还发布了 Amazon Monitron、Amazon Lookout for Equipment、AWS Panorama Appliance、AWS Panorama SDK 和 Amazon Lookout for Vision。这五项全新的机器学习服务共同帮助工业和制造业客户在其生产过程中嵌入智能能力,以提高运营效率,改善质量控制、信息安全和工作场所安全。

  • Amazon Monitron 提供包含传感器、网关和机器学习服务的端到端机器监控解决方案,以检测可能需要维护的异常设备状况。
  • Amazon Lookout for Equipment 为拥有设备传感器的客户提供了使用 AWS 机器学习模型来检测异常设备行为并进行预测性维护的能力。
  • AWS Panorama Appliance 帮助已在工业设施中装配摄像机的客户使用计算机视觉来改善质量控制和工作场所安全。
  • AWS Panorama 软件开发套件(SDK)使得工业相机制造商可以在新相机中嵌入计算机视觉功能。
  • Amazon Lookout for Vision 在图像和视频流上使用 AWS 训练的计算机视觉模型,以发现产品或生产流程中的异常和缺陷。
产业亚马逊云服务(AWS)AWS re:Invent 2020
相关数据
Amazon机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

MXNet技术

MXNet是开源的,用来训练部署深层神经网络的深度学习框架。它是可扩展的,允许快速模型训练,并灵活支持多种语言(C ++,Python,Julia,Matlab,JavaScript, Go,R,Scala,Perl,Wolfram语言)

AMD机构

超威半导体(中国)有限公司专门为计算机、通信和消费电子行业设计和制造各种创新的微处理器(CPU、GPU、主板芯片组、电视卡芯片等),以及提供闪存和低功率处理器解决方案,公司成立于1969年。AMD致力为技术用户——从企业、政府机构到个人消费者——提供基于标准的、以客户为中心的解决方案。

https://www.amd.com/zh-hans
推荐文章
暂无评论
暂无评论~