Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

亚马逊云科技展示Claude 3大模型能力,生成式AI落地正在加速

上周日,亚马逊云科技宣布 Mistral AI 的 Mistral Large 模型在Amazon Bedrock上正式可用。随着知名 AI 初创公司 Mistral AI、Anthropic 的前沿的大语言模型(LLM)陆续登陆 Amazon Bedrock,人们在构建生成式 AI 应用程序时,已经有了一系列先进模型的选择。

在生成式 AI 领域,众多科技巨头和初创企业的技术落地能力正在吸引关注。近日,亚马逊云科技在北京分享了自身在生成式 AI 领域的最新进展。

「从模型能力到真正的运营生产之间,企业还需要增加很多辅助能力,」亚马逊云科技大中华区产品部总经理陈晓建在活动中说道。「Amazon Bedrock 提供一系列广泛的能力,如预置吞吐量功能以保障业务拥有稳定独享的底层资源,模型微调能够将自身的业务数据与大模型快速进行结合,以及能够全面监管大模型的 Guardrails 功能等,这些工程化的能力,是企业在生产环境中一定会需要的。」

生成式 AI 爆发至今已有一年多的时间,在技术突破后,亚马逊云科技积极与基础模型公司进行合作。由于不同行业的场景需求差别很大,没有一个大模型可以胜任所有场景。基于此,亚马逊云科技在生成式 AI 领域为客户提供了三层架构。

・    其中最底层是高性能基础设施,亚马逊云科技提供面向 AI 优化的基础算力,包括英伟达最新推出的 GH200 芯片,以及投入大量资源研发的自研芯片,包括用于训练的 Amazon Trainium,推理芯片 Amazon Inferentia。亚马逊云科技也构建了用于训练和推理的平台 Amazon Sagemaker。

・    中间层是基于 Amazon Bedrock 最广泛的基础模型选择,这些模型来自多个领先的提供商,客户可以在此基础上进行定制,同时保持自身的数据私有和安全,并与其他在亚马逊云科技上的工作负载无缝集成。

・    最上层的则是应用 GenAI 技术的开箱即用的云服务。包括生成式 AI 助手 Amazon Q、面向编程开发人员的平台 Amazon CodeWhisperer 等产品,支持不同客户的业务需求。 

通过这三层架构,不论是具有技术基础的大型科技公司,还是仅有几人的创业公司,不同的客户都可以根据需求构建起生成式 AI 能力以支持自身业务。

在该体系中,Amazon Bedrock 因为不断接入众多业界知名大模型而经常被人提起。

Amazon Bedrock 是亚马逊云科技的一项完全托管服务,提供安全且便捷的方式,让用户能够访问大量完全托管的基础模型(FM)。结合其推出的一系列前沿功能,如检索增强生成(RAG)、Guardrails、模型评估以及 AI 驱动的智能代理(Agent)等,Amazon Bedrock 旨在帮助用户打造高性能、低延迟且具成本效益的生成式 AI 应用程序。

由于「没有一个模型可以适用于所有业务场景」,Amazon Bedrock 旨在提供不同的基础模型供客户选择:其中既有知名的开源模型,如 Stable Diffusion XL、Llama、Mistral 7B 和 Mixtral 8×7B,也有如 Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan 等非开源模型。

Anthropic 是亚马逊的重点合作伙伴,这家创业公司成立于 2021 年,其推出的 Claude 大模型系列被认为是 GPT-4 的重要竞品。亚马逊与它的合作紧密,在去年 9 月份宣布了高达 40 亿美元的投资。

Claude 大模型的最新第三代在上个月刚刚推出,其分为三个版本,分别是 Haiku、Sonnet、Opus 三款模型,均已经或即将在 Amazon Bedrock 上提供。

Claude 3 的三个体量模型分别适用于不同产品,它们在复杂任务重表现出的理解能力,逻辑性、速度等在业内领先。可以看到, Claude 3 大模型的百万 token 价格在业内是非常低的。

Anthropic 表示,Claude 3 Opus 拥有人类本科生水平的知识。Claude 3 在(斯坦福 100Q Hard)上准确性明显提升,减少了错误答案和幻觉。

它支持 200k token 的超长文本召回。在大海捞针实验中拥有良好性能,展示了 AI 可以识别超长内容中的逻辑的能力。

此外,Claude 3 首次带来了对多模态能力的支持,用户现在可以上传照片、图表、文档和其他类型的非结构化数据,让 AI 进行分析和解答。

在活动中,亚马逊云科技展示了 Claude 3(Sonnet)的一系列能力。如黄仁勋在英伟达 GTC 上 keynote 的解读和续写:

在流浪地球中插入一句三体的内容,让大模型进行识别:

Claude 3 也能准确地识别出来。

亚马逊云科技表示,很快 Claude3 的「超大杯」版本也将登录 Amazon Bedrock。

大模型正在改造应用的多种使用方式,我们正在看见这件事正在发生。在活动中,亚马逊云科技表示大模型已被融入到自身业务中,其在电商领域推出了基于生成式 AI 的专业购物助理 Rufus,它能够基于人的习惯,通过自然语言与客户进行沟通。

例如,你在购买时需要考虑哪些因素?如果我需要购买一辆自行车,那么在冬天骑车时需要注意什么,以及可以购买什么样的配件等。

新系统在通过自然语言实现与人自然交互的同时,背后还能够根据亚马逊电商的庞大知识库实现准确的问答。通过这个能力,电商能与客户进行全方位的自然语言沟通。这是一个把大模型技术与核心业务相结合的典型案例。同样的事,也会很快推广到更多客户的业务当中。

在生成式 AI 时代,亚马逊云科技一直在做「最后三公里」的支持。

为了更好地利用已有数据基础,使用技术领先的工具,面对复杂的客户场景,亚马逊云科技提供了本地化的支持团队,希望与用户共同寻找场景和解决方案。在生成式 AI 时代,这或许会是技术能够快速落地的正确方式。

「尽管大模型非常重要,但仅靠大模型对你的生产是远远不够的。企业需要一系列周边的能力来正确、合理、安全、高效地使用大模型,这就是亚马逊云科技一系列产品所提供的价值所在,」陈晓建表示。

产业Anthropic多模态大模型亚马逊云服务(AWS)AWS云计算
暂无评论
暂无评论~