5 月 11 日,在机器学习服务 Amazon SageMaker 落地中国区一周年之际,亚马逊云科技宣布在中国区进一步落地了多项人工智能与机器学习的新服务。
「应用 AI 技术最早的是互联网公司,但目前看来,真正可以使用 AI、机器学习技术作为生产工具能实现提升,更多的还是传统行业,」在昨天的活动中,亚马逊云科技大中华区产品部总经理顾凡说道。「而这部分行业的智能化转型更加需要赋能。」
自 2003 年在业内首次引入推荐算法至今,亚马逊的机器学习技术已经覆盖了自身电商、机器人设备、视频服务、物流、语音智能操作系统等各个领域。其提升用户提现为核心的机器学习的核心理念使其在将技术转化为服务时获得了众多公司的欢迎。「在亚马逊,自家电商网站与和亚马逊云之间也是客户和平台的关系,如今亚马逊云服务的服务超过了 200 种。」顾凡表示。
根据亚马逊的数据,如今全球有超过十万客户使用亚马逊云科技进行机器学习工作。如果观察最流行的 AI 框架,则有 92% 的 TensorFlow 云上负载,和 91% 的 PyTorch 负载是运行在 AWS 上的。目前,在云上进行机器学习模型的构建、训练和部署已是非常成熟的选择,为此亚马逊围绕机器学习的整个流程提供了全面的工具,仅在去年一年,亚马逊云的 AI 服务就新增了 250 多项机器学习功能。
亚马逊云科技针对不同需求的客户,在机器学习技术堆栈的三个层面提供了完整的机器学习服务,包括顶层 - 人工智能服务、中间层 - 机器学习服务以及底层 - 框架和基础架构。在人工智能(AI)服务层面,亚马逊在北京区域推出了 Amazon Personalize,客户无需具备机器学习专业知识,即可方便、快速地构建个性化推荐系统。
在中间层,将 Amazon SageMaker 最近新增了刚刚在 re:Invent 2020 上亮相的 Data Wranger、Feature Store、Pipelines 等七项新功能,可以让客户更轻松地构建端到端的机器学习管道。
在机器学习领域里,亚马逊云需求量最大服务的是 SageMaker,其服务于开发者和数据科学家,面向企业基于 AI 的规模化产出。这套工具专注于算法和模型的迭代、基础设施管理,可以把人们从机器学习开发过程中繁琐重复的步骤中解放出来。
在昨天的活动中,亚马逊云科技新发布的七项新功能让 Amazon SageMaker 更加强大。
去年 12 月在亚马逊云科技全球大会 re:Invent 2020 上刚刚亮相的七项 Amazon SageMaker 新功能,已经在北京区域和宁夏区域落地,其中包括:
1、Amazon SageMaker Data Wranger,简化机器学习的数据准备工作。通过该功能,亚马逊允许客户将各种数据存储中的数据一键导入。Amazon SageMaker Data Wrangler 内置了 300 多个数据转换器,让客户无需编写任何代码,就可以对机器学习用到的特征进行规范化、转换和组合。
2、Amazon SageMaker Feature Store,一个完全托管且专门构建的特征存储库,用于存储、更新、检索和共享机器学习特征。客户可以在其中存储和访问特征,以便更轻松地在各个团队中对其进行命名、共享和重复使用。
3、Amazon SageMaker Pipelines 是业界首个针对机器学习专门构建、易于使用的持续集成和持续交付服务,通过编排和自动化提高机器学习工作的效率。借助该服务,用户可以大规模地创建、自动化和管理端到端机器学习工作流。
4、Amazon SageMaker Clarify 让机器学习开发人员可以更好地掌控其训练数据和模型,从而识别和限制偏差并解释做出相关预测的原因。
5、Amazon SageMaker Distributed training libraries 为训练大型深度学习模型和数据集提供了易用的方法,与现有分布式训练实现相比,以最高快 40% 的速度完成分布式训练,并且帮助用户减少手动实施数据并行和模型并行策略所需时间。
6、Amazon SageMaker* Model Monitor 帮助客户时刻保持机器学习模型的准确性,它能够自动检测生产环境中部署的模型,并在检测到不准确的预测时发出警报,从而帮助客户维护高质量的机器学习模型。
7、Amazon SageMaker Debugger,可以通过实时捕获训练指标,自动识别机器学习训练任务中正在出现的复杂问题,例如梯度值变得过大或过小等。它可以实时监控系资源(例如 GPU、CPU、网络和内存等)的利用率,帮助用户提高资源利用率,对训练过程中的资源瓶颈进行告警,让开发者及时调度资源,快速采取纠正措施,减少时间和成本浪费。
中国拥有巨大的 AI 应用场景,是所有云服务厂商希望占领的重要市场,亚马逊的 SageMaker 目前已有 20 余个工具,涵盖了整个机器学习开发的生命周期。其全球首个机器学习集成开发环境(IDE),可以提高数据科学家效率达到 10 倍,降低机器学习总体拥有成本高达 54%。
在人工智能服务层面,针对没有机器学习专业知识和能力的客户,亚马逊云科技又提供了开箱即用的人工智能服务 Amazon Personalize。这是一项用于构建个性化推荐系统的完全托管型机器学习服务,已在北京区域上线。使用这一工具,开发人员无需具备机器学习专业知识,即可训练、调整和部署自己定制的机器学习模型,构建个性化推荐系统,可用于产品推荐、个性化营销、个性化搜索和定制化直销等广泛的个性化推荐场景。
在算力层面,亚马逊云科技在北京区域和宁夏区域推出了 Amazon EC2 Inf1 实例,该实例基于亚马逊云科技自研机器学习推理芯片 Amazon Inferentia,与当前成本最低的基于 GPU 的实例相比,可以提高多达 30% 的吞吐量,并使每次推断的成本最高降低 45%。
在机器学习底层的框架和基础架构层面,亚马逊云科技提供了基于各家芯片供应商的最新技术选项,支持市面上流行的各种机器学习框架和算法。同时亚马逊还自主设计推出了高性能机器学习推理芯片 Amazon Inferentia,基于 Inferentia 的 Amazon EC2 Inf1 实例落地北京区域和宁夏区域,让人们又多了一种云端高性能和更低成本机器学习推理的算力选择。
目前,全球数以十万计的客户选择亚马逊云科技运行机器学习工作负载。在中国,亚马逊云科技机器学习服务得到医疗健康、教育、出行、工业智能、游戏、新媒体等各个行业客户的青睐,其服务得到了益体康、晶泰科技、新世纪医疗、LEMONBOX、有道乐读、叽里呱啦、全美在线、首汽约车、德比软件、Momenta、图森未来、行者 AI、天和荣、中科创达、华来科技、大宇无限、陕西科技大学、易点天下、淄博热力等一批企业和机构的广泛采用,在各行各业实现了多种人工智能应用创新。
在活动中,山东淄博市热力集团应用亚马逊云科技机器学习技术快速构建 AI 模型的案例吸引了人们的关注。
自 2018 年起,淄博热力集团有限责任公司在与亚马逊开展合作的同时建立起了自己的数据工程师团队,在山东省淄博市实现了精准供热。从第一期的数据清理、平台整合,第二期的试点到第三期的技术推广,目前淄博的供热系统可以根据气象、工控数据、建筑物维护结构等信息计算出最佳的供热模式,并给出具体的操作指令,既让用户室温始终保持人体最佳舒适温度,又做到尽可能节约成本。
根据测算,该供暖系统的单位耗能从每平方米 0.4GJ 降到了不到 0.3GJ,结合清洁能源的使用,每年节约标煤 15 万吨。
淄博市热力集团有限责任公司董事长、党委书记汪德刚表示,「多年来,淄博热力利用信息化手段改造传统供热,致力于成为行业标准的制定者和行业发展的引领者。通过与亚马逊云科技合作,借助机器学习能力创新,建成了基于机器学习和大数据分析的智能供热平台,帮助我们从传统供热向产业智能化方向转型,在满足用户需求的同时实现节能减排,建立绿色能源生态系统。」
未来,淄博热力还希望通过业内领先的云技术持续创新,推动国内更多的热力企业实现数字化、智能化转型。