Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

0.6秒出图!手机跑Stable Diffusion创下最快速度,而这仅仅是开始

如今,随着将大模型塞进手机的进程加快,普通用户也能亲自体验生成式 AI 的魅力了。


2023 已经行至尾声,这一年大模型和生成式 AI 成为人工智能圈的主流趋势。自 ChatGPT 出现以来,各式各样通用、专业的 AI 大模型层出不穷,喷涌之势已经不可阻挡。随着量化、网络剪枝知识蒸馏等模型压缩技术进步,手机等终端设备 AI 算力持续增强,大模型在云端部署之外正在向终端落地迈进。

对于这场已经拉开了序幕的「终端侧革命」,芯片巨头和手机厂商们成为主力军,他们不断尝试在手机等终端设备上部署运行生成式 AI 大模型,时不时给人们一点小小的惊喜和震撼。

今年 2 月,我们第一次看到了在手机上运行超过 10 亿参数的文生图大模型 Stable Diffusion。那是在一部搭载高通第二代骁龙 8 移动平台的安卓手机上运行的,不到 15 秒的时间执行 20 步推理,生成了一张 512×512 像素的图像。这也创造了当时智能手机上最快的推理速度。

图片

你以为这就是手机运行 Stable Diffusion 的速度极限了吗?显然不是。在上个月举行的 2023 骁龙技术峰会上,不到 15 秒的生成时间又被整整缩短数十倍。高通最新旗舰移动平台第三代骁龙 8(以下简称骁龙 8 Gen 3)让速度飞升成为可能。

在峰会现场,高通用搭载了骁龙 8 Gen 3 的手机运行相同的 Stable Diffusion 大模型,这次不到 1 秒(0.6 秒)的时间便在本地生成了一张图像。从 15 秒到 0.6 秒,终端侧生成式 AI 大模型的进化速度让我们惊叹不已。

图片

这只是高通在本届骁龙技术峰会上展示其终端侧 AI 能力的牛刀小试。除了生成速度(从 15 秒到 0.6 秒)有了质的飞跃,骁龙 8 Gen 3 将支持运行的大模型参数规模(从 10 亿到百亿)提升一个量级。

大模型赋能平台也不再局限于手机,高通下一代 AI PC 芯片骁龙 X Elite 亮相,将百亿参数大模型「塞进」PC 平台,极大拓展了生成式 AI 应用的广度。
 
至此,高通在终端侧 AI 领域积累起来的领导力和技术领先性进一步得到加强,更赋予了手机、PC,甚至耳机等厂商更多终端 AI 落地的想象力和可能性。

双平台并进,让生成式 AI 更加触手可及

自今年 2 月以来,高通先后在搭载第二代骁龙 8 移动平台的安卓手机上运行 Stable Diffusion、ControlNet,让大模型跑在手机端成为现实。此次骁龙峰会上发布的骁龙 8 Gen 3 将大模型终端侧落地的潜力提升到了新的高度,使其自身继续在该领域引领潮流。

图片

据了解,骁龙 8 Gen 3 采用的高通 AI 引擎拥有面向移动终端的强大 Hexagon NPU,集成了升级后的硬件加速单元、微切片推理单元、加强张量、标量和矢量单元,所有单元共享 2 倍带宽的大容量共享内存。同时支持 INT8+INT16 的混合精度以及 INT4、INT8、INT16 和 FP16 的所有精度。性能较前代提升 98%,能效提升 40%。

骁龙 8 Gen 3 集成的高通传感器中枢也更强,拥有 2 个始终感应 ISP、2 个 micro NPU 和 1 个 DPS,内存增加了 30%,支持 INT4 精度,AI 性能提升了 3.5 倍。

图片

可以说,骁龙 8 Gen 3 赋予了手机前所未有的强大终端侧 AI 性能,成为高通首个专为生成式 AI 打造的移动平台。那么这款旗舰级移动平台是否名副其实呢?这是我们大家最为关心的问题。

在该平台上,高通 AI 引擎首次支持多模态生成式 AI,包括了多种大语言模型、视觉语言模型等。尤其是在终端侧,骁龙 8 Gen 3 首次支持运行 100 亿参数的模型,规模迈入百亿量级。同时将 Stable Diffusion 生成图像的时间降到了 1 秒之内,再次创下最快速度。

在跑 Meta 大语言模型 Llama2-7B 时,骁龙 8 Gen 3 每秒可以生成 20 个 token,同样是手机终端侧最快之一。

图片                               高通公司产品管理高级副总裁 Ziad Asghar

现在,骁龙平台已经支持运行 OpenAI、Meta、微软、安卓、stability.ai、BLOOM、百度、智谱、百川智能、有道等企业或机构的大模型,既为这些厂商将自身大模型能力「下放」到终端侧提供契机,也为用户体验生成式 AI 带来了丰富的选择项。

牵一发而动全身,随着高通在赋能大模型终端落地上的进一步动作,采用骁龙 8 Gen 3 移动平台的手机厂商快速跟进,加速了大模型集成到手机的进程。

以首发搭载骁龙 8 Gen 3 移动平台的小米 14 系列新机为例,AI 大模型技术已经集成到小米全新澎湃 OS 中,并上线各种终端侧应用。有了大模型能力加持,小米 14 支持了 AI 妙画、AI 搜图、AI 写真、AI 扩图等多项功能,让输入法、WPS、相册焕发新的活力。

图片

vivo 旗下品牌 iQOO 12 系列同样搭载了骁龙 8 Gen 3 移动平台,全新高通 AI 引擎使其影像体验大幅升级,照片质感和细节拉满。同时该系列手机预装的 OriginOS 4 系统引入生成式 AI 功能,AI 助手蓝心小 V 可以进行超能语义搜索、超能问答、超能写作、超能创图、超能智慧交互,智能化程度明显提升。

图片

此前在骁龙峰会上,荣耀 CEO 赵明宣布新旗舰手机荣耀 Magic 6 将搭载骁龙 8 Gen 3 移动平台,已支持 70 亿参数的终端侧 AI 大模型,为用户提供更加智能化的体验。他在现场演示了终端侧 AI 进行照片搜索、生成视频等智能操作,效果着实不错。

图片

手机终端融合大模型能力催生了大量或好玩、或有助于提升生产力的生成式 AI 应用。未来更加丰富的生成式 AI 应用会让更多用户切身体验到 AI 的魅力,提升自身交互体验,这也正是高通致力于在终端侧打造生成式 AI 能力的重要源动力之一。

在持续利用 AI 赋能手机移动平台之外,高通也在寻求利用并把握好大模型及生成式 AI 的发展契机,以此来重塑 PC 行业,扩大自身在 AI 领域的领先优势。

生成式 AI 有了「第二阵地」

高通发布了面向 PC 平台的全新处理器骁龙 X Elite,它采用 4nm 制程工艺,集成定制的高通 Oryon CPU,运行速度是英特尔 12 核处理器的 2 倍,功耗比英特尔竞品低 68%,高峰时段的运行速度比苹果 M2 快了 50%。

如果这些参数还无法让你相信骁龙 X Elite 的强悍,那就跑个分吧。骁龙 X Elite 拥有两个版本:分别是注重续航表现的 23W 版本和主打性能的 80W 版本。Geekbench 6 测试下的单核和多核得分情况如下图所示,单核性能尤为亮眼。

图片                                      图源:fonearena

同样地,骁龙 X Elite 专为 AI 打造。它采用业界领先的、集成高通 Hexagon NPU 的高通 AI 引擎,异构算力高达 75TOPS,Hexagon NPU 算力为 45TOPS,为创意应用、视频会议和生产力助手的变革性体验提供了算力基础。高通 AI 引擎还支持了大量的加速应用程序和体验,创造无限可能性。

强生成式 AI 能力也成为骁龙 X Elite 的一大标签,截止到发布时,它已支持在端侧运行超过 130 亿参数的生成式 AI 模型,面向 70 亿参数大模型每秒生成 30 个 token,AI 处理速度是竞品的 4.5 倍。下图为 PC 端 AI 作画能力的展示。

图片

从手机到 PC,多样化的端侧平台为释放生成式 AI 能力提供了更多渠道。这也表明,高通在终端侧生成式 AI 落地这条赛道上继续「加码」,背后既离不开技术上的厚积薄发,也是其在大模型时代自身 AI 发展战略的延续。

手机、PC 加速迎来全新 AI 时代

在当今大模型时代,终端侧部署生成式 AI 这条路线越来越明晰。基于此,高通始终秉持「混合 AI 是 AI 的未来」这一理念和战略,注重云端与终端的协同发展,并认为终端侧 AI 是扩展生成式 AI 至全球更广泛范围的关键。

遵循这一前瞻性认知,高通一步步积累,逐渐在自身布局中构建了强大、全面的终端侧 AI 能力,并引领了端侧大模型及生成式 AI 的革新与进步。毫无疑问,此次骁龙峰会上发布的骁龙 8 Gen 3、骁龙 X Elite 将进一步夯实高通作为终端侧 AI 领导者的地位。图片                                 高通全栈 AI 优化方案

如果大模型继续保持当前的落地步伐,我们将可以在手机、PC 甚至 XR 可穿戴设备、智能网联汽车等智能终端上体验到更多生成式 AI 应用,让人机交互更加自然且个性化。反过来,这些生成式 AI 应用以及带来的体验变革也将对这些终端设备产生深远影响,甚至改变它们的核心驱动力,重新定义它们。

我们以与人们工作、生活息息相关的手机为例,在追求绝对性能之外,人们越来越多地关注一些创意性应用。这就需要 AI 大显身手,生成式 AI 性能更是成为下一代手机处理器角逐的核心竞争力。

因此,骁龙移动平台近年来持续发力于此也在意料之中了。从去年的骁龙 8 Gen 2 到此次骁龙峰会上的骁龙 8 Gen 3,AI 早已无处不在,生成式 AI 一跃成为「AI 皇冠上的新明珠」,受到了广泛关注和青睐。

随着大模型及生成式 AI 在手机终端落地的范围越来越广、成熟度越来越高,我们或许可以看到:传统智能手机被生成式 AI 能力全方位加持的「AI 手机」所取代。小米等手机厂商新发布的旗舰机在这方面已经初具雏形,利用生成式 AI 增强一些场景的使用体验和效率,为未来颠覆手机的质变做好了充分的量变。

同时,PC 终端的革新也有类似向生成式 AI 能力倾斜的发展趋势。在这方面,集成到 Windows 中的微软 Copilot 是一个很好的例证。当然还有更多生成式 AI 变革人与 PC 交互的场景和方式,借此实现更高效的智能协作、更简化的工作流程、更强大的生产力、更定制化的使用体验。

骁龙 X Elite 一出手便瞄准生成式 AI,势必会为当前的 PC 市场注入新鲜血液。在第六届虹桥国际经济论坛 ——「智能科技与未来产业发展」分论坛上,高通公司中国区董事长孟樸发表了主题演讲,认为下一代 PC 将进入一个全新的「AI PC」时代,以智能、高性能、高效等为特点, 并将对办公效率等方面产生重要意义。
 
相信未来高通会在骁龙 8 Gen 3 等移动平台和骁龙 X Elite 等 PC 平台的基础上,继续加强自身在大模型和生成式 AI 上的基础能力。加之更多搭载这些平台的厂商发布全新旗舰手机和 PC 产品,他们不断增强的自主性及自研能力可以让我们期待更多样化生成式 AI 应用的亮相。

不过,在「AI 手机」和「AI PC」的 时代真正到来之前,还要看生成式 AI 能力是否能让用户产生强烈感知、是否能准确满足他们的需求、是否能对相关应用产生依赖性、以及是否能带动他们换机的欲望,这些都是高通和手机厂商现在及未来要考虑的问题。

结语

自发布以来,骁龙 8 Gen 3、骁龙 X Elite 展现出的强大生成式 AI 能力留给人们无限的想象空间。正如高通公司总裁兼 CEO 安蒙所言,「我们正在进入将改变用户体验的生成式 AI 时代,也将创造一个移动行业和计算行业的全新周期。」

在这一进程中,作为终端侧领导者的高通正担负起应有的时代角色。一方面,利用自身强大的全栈 AI 优化能力汇聚软硬件各方,助力终端侧 AI 生态快速发展;另一方面,全新的跨平台技术「Snapdragon Seamless」实现安卓、Windows 和其他操作系统无缝衔接,这种多终端体验有望将 AI 在手机、PC 等终端上的落地进一步拓展开来。

可以预见,基于骁龙生态的 AI 体验会非常快速铺展开来,各种应用落地的速度也将大大加快。未来,高通将继续保持自身在终端侧 AI 的技术优势,推动大模型在部署应用时更便捷、更丰富、更有吸引力。同时携手各大厂商创新基于大模型的生成式 AI 应用,降低普通用户使用生成式 AI 的门槛。

随着新的生成式 AI 时代开启,高通是否能持续满足人们的期待,我想这次骁龙峰会已经给了我们答案。

参考链接:
https://www.qualcomm.cn/news/releases/2023/10/releases-2023-10-24-3
产业2023 骁龙技术峰会
相关数据
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

剪枝技术

剪枝顾名思义,就是删去一些不重要的节点,来减小计算或搜索的复杂度。剪枝在很多算法中都有很好的应用,如:决策树,神经网络,搜索算法,数据库的设计等。在决策树和神经网络中,剪枝可以有效缓解过拟合问题并减小计算复杂度;在搜索算法中,可以减小搜索范围,提高搜索效率。

张量技术

张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 维空间内,有 个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。称为该张量的秩或阶(与矩阵的秩和阶均无关系)。 在数学里,张量是一种几何实体,或者说广义上的“数量”。张量概念包括标量、矢量和线性算子。张量可以用坐标系统来表达,记作标量的数组,但它是定义为“不依赖于参照系的选择的”。张量在物理和工程学中很重要。例如在扩散张量成像中,表达器官对于水的在各个方向的微分透性的张量可以用来产生大脑的扫描图。工程上最重要的例子可能就是应力张量和应变张量了,它们都是二阶张量,对于一般线性材料他们之间的关系由一个四阶弹性张量来决定。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

知识蒸馏技术

Hinton 的工作引入了知识蒸馏压缩框架,即通过遵循“学生-教师”的范式减少深度网络的训练量,这种“学生-教师”的范式,即通过软化“教师”的输出而惩罚“学生”。为了完成这一点,学生学要训练以预测教师的输出,即真实的分类标签。这种方法十分简单,但它同样在各种图像分类任务中表现出较好的结果。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

强生机构

强生公司成立于1886年,是全球最具综合性、业务分布范围广的医疗健康企业之一,业务涉及制药、医疗器材及消费品三大领域。强生坚信健康是活力人生、繁荣社区和不断进步的基础。正因如此,130多年来,公司始终致力于推进健康事业,让人们在每个年龄段和每个人生阶段都保持健康。

http://www.jnj.com/
量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

推荐文章
暂无评论
暂无评论~