Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

生成式AI的落地方式,亚马逊云科技给了我们答案

大模型落地的挑战,亚马逊云科技都看到了。

在生成式 AI 的浪潮中,亚马逊云科技将会占据怎样的位置?

最近一段时间,基于亚马逊云科技的生成式 AI 服务正式上线,人们可以利用各种业内领先大模型作为基础,使用自身数据训练出面向特定领域的专用模型。与此同时,亚马逊云科技还有专用于 AI 负载的算力基础设施,以及自动化编程工具。

或许很快,这套全家桶就会成为各行业应用重构的标准方式。

本周在上海举行的峰会上,亚马逊云科技全球产品副总裁 Matt Wood 博士向我们分享了公司对于生成式 AI 的愿景。

亚马逊云科技表示,这套新服务体系,是近十余年来机器学习经验与即将改变一切的突破性技术的结合。

在这其中,最引人关注的是 Amazon Bedrock,这是一套在云计算平台上构建生成式 AI 应用的服务。利用大模型的能力,这些新类型的应用可根据提示生成文本、图像、音频和合成数据。

在 Amazon Bedrock 推出前后,国内外各家公司也相应推出了类似的服务,希望抢占大模型技术落地的先机,但相对而言,亚马逊云科技选择了一条更为开放的道路。Amazon Bedrock 引入了来自顶级 AI 初创公司模型提供商(包括 AI21Labs、Anthropic 和 Stability AI)的基础模型(FM),同时也包含亚马逊云科技自研的 Titan 系列模型。

「我们认为不能依赖单一的大语言模型来应对各种任务。正确的做法应该是:客户可以访问多个模型,然后根据自己的需求和数据来定制自己的模型,」Matt Wood 说道。「所以总结来说,我们并不认为有一个所谓万能大模型,并且由其他人来掌控。我们认为应该在大模型的基础之上,确保以私密和安全的方式让用户能够定制自己的模型。」

Amazon Bedrock 的关键优势在于让开发者可在其上构建项目,并与亚马逊云科技平台的其余部分集成在一起。这意味着人们能够更轻松地访问数据,调用资源,并从亚马逊已有的成熟云服务访问控制和治理策略中受益。这些优势让 Amazon Bedrock 成为了构建和扩展生成式 AI 应用程序的最简单方法。

有专为大模型构建的服务,也有专为大模型设计的 AI 计算实例。亚马逊同步推出了由自研 AI 专用训练芯片 Amazon Trainium 提供支持的 Amazon EC2 Trn1n 和由推理芯片 Amazon Inferentia2 提供支持的 Amazon EC2 Inf2 实例。

亚马逊表示,在 Trn1n 上,EFAv2 通过将集体通信性能提高多达 50%,加快了分布式训练。用户在训练大模型时可以使用 UltraClusters 扩展到多达 3 万块 Trainium 加速器,相当于计算性能为 6.3 exaflops 的超级计算机。

而由最新机器学习芯片 Amazon Inferentia2 所支持的 Inf2 实例,专门针对包含数千亿个参数的模型的大规模生成人工智能应用进行了优化。与上一代基于 Amazon Inferentia 的实例相比,Inf2 实例的吞吐量提高了 4 倍,延迟降低了 10 倍。

为了提升第一线的开发工作效率,亚马逊宣布推出了 Amazon CodeWhisperer。这种 AI 编程伴侣可根据开发人员的自然语言评论和集成开发环境(IDE)中的先前代码实时生成代码建议,通过生成解析字符串并返回指定列表的完整函数来提高工作效率。在亚马逊云科技内部的实验中,与未使用该编程助手的开发者相比,使用者完成任务的速度平均快 57%,成功率提高 27%。

值得关注的是,Amazon CodeWhisperer 对于个人用户是完全免费的。

在生成式 AI 的竞争中,亚马逊云科技着重展示的是自身全流程式服务,作为全球最大云服务厂商,亚马逊入局大模型军备竞赛,其目的在于构建 AI 基础能力,帮助其他公司技术落地。看起来,这样的服务对于希望快速进行生成式 AI 落地的企业来说具有较高的吸引力。

目前,Amazon Bedrock 上可用的基础模型在业界属于很高水平,但与 GPT-4 相比,可能还存在一定差距。对于未来生成式 AI 的应用方式,亚马逊云科技也有明确的思考。

「现在很多公司构建的大模型都是通用目的型模型,这些模型广泛适用于各种类型的问题,但博而不渊。对于聊天机器人、搜索等场景表现不错,但绝大多数用户希望模型能在特定领域能有更深入的理解和解决问题的能力。所以从这方面来说,Amazon Bedrock 是一个很好的选项,」Matt Wood 说道。

此前,有一些特定领域的大模型是在亚马逊云科技的平台之上进行训练的。例如,今年 3 月,彭博在亚马逊云科技上面构建了一个金融服务模型 BloombergGPT。

这是一个具有 500 亿参数的大语言模型,类似于 ChatGPT 但专注于完成金融领域的各种任务,并取得了较好的效果。试用者表示,该模型可以理解商业公司 CEO 的名字,可以生成新闻标题,可以编写 BQL 查询(访问彭博数据的查询)。这些行为在其他通用大模型中是无法出现的。

实际上,同样的方法也适用于其他的业务,人们可以根据自身行业来选择相应的基础模型,然后对模型进行训练。此外,人们还可以根据自身需要来添加独有的、私有化的信息,从而使模型的输出结果和他们提出的问题或者需求高度相关。在 Amazon Bedrock 上训练大模型时,客户的模型是与基础模型互相隔离的,不会出现数据泄露的风险。

Amazon Bedrock 未来是否会成为「大模型市场」?对此,亚马逊云科技希望走专精路线。

「我们可以预见到会有越来越多的第三方模型、开源模型出现。同时,也会有更多的 Amazon Titan 的模型可供客户选择,」Matt Wood 说道。「但 Amazon Bedrock 不会发展成为一个『应用市场』,相反,我们会选择那些最有趣的、最有用的模型,而且确保它们是低时延的,而且具有广泛可用的运维性能。」

在亚马逊云科技的愿景中,未来 Amazon Bedrock 上可能会出现几十个重量级模型产品,它们用途广泛或在特定领域能力突出,而由它们衍生出的行业大模型数量将会是成百上千。通过 Amazon SageMaker JumpStart,用户可以去选择的他们想要的基础模型,然后进行重新训练,不断构建出自有模型,使之能够与需求高度匹配。

「就生成式 AI 而言,我们目前还处在一个非常初期的阶段。这就像一场马拉松比赛,这是一场长期的竞争。我们现在还处于非常早期的阶段,相信接近终点时,我们能够看到亚马逊云科技能够为客户在生成式 AI 应用构建方面提供最简单、最经济以及最安全的服务,」Matt Wood 说道。

最后,亚马逊云科技认为在未来短期内,Amazon Bedrock 等服务将能提供具备竞争力的价格,且可以通过即用即付的方式大幅降低用户在大型模型训练前期的巨大投入。

「未来,用户可以按照输入和输出内容的字数来进行付费,这样的话,成本将会大幅降低。我们认为这种方式足够简便,不论是科技巨头还是创业公司都可以适用,」Matt Wood 表示。

亚马逊云科技帮助人们以更快、更低的成本训练模型,并以低门槛的方式部署和实践,最终将为业界带来更多生成式 AI 服务。

产业预训练大模型AWS
1
暂无评论
暂无评论~