Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

给5G基带也加上机器学习单元:高通的AI脑洞还有太多

最先进的人工智能技术,并不总意味着数块 GPU、每秒算力上 E 的超算。

应用最广泛的移动芯片上,人们正在使用最先进的 AI 技术。最近,高通再次利用 AI 实现了「突破性的 5G 效能」。

在巴塞罗那举办的 MWC 2022 国际通信展上,高通 CEO 安蒙(Cristiano Amon)发布了全球首款搭载 AI 计算核心的 5G 通信基带骁龙 X70。

图片


在显卡、手机 CPU 旁边出现 AI 计算单元之后,现在连通信基带也要专门的 AI 芯片加持了 ,这不仅让人要问:「有必要吗?」

首款搭载 AI 核心的 5G 基带

根据高通官方的表述,骁龙 X70 是高通第 5 代 5G 调制解调器和射频系统,作为全球首款 5G AI 处理器,可以实现包括 10Gbps 5G 下载速度、3.5Gbps 上传速度、更低时延、更强的网络覆盖和能效。

为实现这样的能力,作为一款 5G 基带,骁龙 X70 也搭载了专门的 AI 处理单元,配合整套基于人工智能的优化机制,算法控制的范围涵盖了从毫米波波束管理、天线调谐到网络选择、功耗等所有内容。

图片


骁龙 X70 上的 5G AI、低时延套件和四载波聚合技术可以实现更大范围的网络覆盖、信号质量和低时延。其中,5G AI 套件专为低于 6 GHz 和毫米波 5G 链路的 AI 驱动优化而设计,实现了 AI 辅助信号反馈、动态优化和 AI 辅助毫米波波束管理。

具体来说,在移动通信系统中,终端(手机)需要实时探测信道状态上报基站,基站则在下行调度时为终端选择较合适的调制方式、更好的时频资源。通过 AI 算法的加持,信道状态的预测和反馈将更加精准,基站也能实现更好的动态优化,从而提升通信效率。 

图片


通过仿真数据可以发现,在突发数据流量情境中,AI 辅助信道状态反馈和优化能够针对小区边缘、中段和中央分别实现 20%、16% 和 24% 的下行吞吐量提升。典型数据流量情境中,AI 算法能让手机在小区边缘获得的下行吞吐量增益达到 26%,中段下行吞吐量增益达 12%。

骁龙 X70 实现了全球首个 AI 辅助毫米波波束管理,算法管理的波束可以智能化地对不确定的环境进行预测,实现更好的网络覆盖与稳定性。

实际应用中,手机通常能接收到多种不同的网络频率。在多频率和不同网络制式的环境下,X70 上的 AI 还可以智能识别和检测不同连接的状态,减少卡顿,提高用户体验。

最后还有 AI 辅助自适应天线调谐,这项技术用来避免「死亡之握」,通过智能侦测握持终端的情况,手机可以实时动态调谐天线。

在新技术加持之下,骁龙 X70 的能效提升了 60%。高通宣布,骁龙 X70 预计于 2022 年下半年开始向客户出样,商用移动终端预计在 2022 年晚些时候面世。

手机芯片只是一小步

人们用 AI 为 5G 增强信号的尝试已不是头一次——在当前骁龙 8 集成的骁龙 X65 上,机器学习算法就可以通过用户握持和使用智能手机的方式动态调整无线接收功率,帮助最大化信号强度。在手机上,我们经常可以看到最先进的人工智能应用。

最近一段时间,小米 12、OPPO Find X5、iQOO 9、荣耀 Magic 4…… 各家手机厂商的新旗舰机型都用上了最新一代高通骁龙 8 移动平台,AI 在其中低调的发挥着强大的作用。

这些新机不仅有更快的充电速度、更好的屏幕,还有不少新功能:如在录音时自动语音转文字、排版区分说话人的 APP,实时为视频增加翻译字幕的翻译机,注视亮屏,隔空手势操作等功能也不再是新奇的概念。

还有更能体现手机智力的技术:在你看信息时,如果前摄像头发现有别人也在盯着屏幕看,手机会自动隐藏通知详情,避免你的泄露隐私。

图片

OPPO Find X5 Pro 上,ColorOS 12.1 的部分新功能。

在日常使用处理器性能普遍过剩的情况下,各家手机厂正寻求利用 AI 能力提供更好体验,这些新功能的背后,骁龙 8 的 AI 算力功不可没。

这枚芯片搭载的第 7 代 AI 引擎,将 GPU、Hexagon、CPU 的全部 AI 能力整合在一起,实现了性能翻四倍的表现。另外在第 3 代传感器中枢中还有一个「always on」芯片模块,可以用极低的功耗驱动摄像头 24 小时在线,实现二维码识别、自动唤醒等功能。

手机玩明白了,但高通的想法还远不止于此,在巴塞罗那展会上,CEO 安蒙对公司的「统一技术路线图」进行了分享。

「我们的思考从不限于特定的设备和技术,而是通过互联的力量将多种不同能力推向终端,从机器学习图形处理能力到语音识别能力,再到更高算力需求的自动驾驶领域,」安蒙说道。「在智能云成熟之后,我们需要重新思考端侧设备的智能,而新能力可以让机器理解周围环境,它们拥有很高的算力,能耗也很低。」

图片


据统计,全球云计算的年增长率约为 35%,几乎所有设备都有连接云端的需求。

高通早在 2019 年便推出了自己的首款数据中心 AI 推理加速器 Cloud AI 100,目标为工业和商业领域中的边缘推理工作负载,这款芯片在部分任务中推理效率超过了英伟达同级产品。

图片


从架构上看,目前的旗舰手机芯片骁龙 8 已有端云互联的新能力:它首发搭载的 ARM v9 指令集是近十年的最大一次更新,在安全性、AI 能力、可伸缩矢量扩展和 DSP 等方面进行了升级,更重要的是,ARM v9 为芯片实现高性能计算做了铺垫。

为满足人们不断膨胀的算力需求,ARM v9 用上了全新 SVE2(可伸缩矢量扩展)指令集,增强了 ARM 架构在高性能计算、5G 网络、虚拟现实、AI 和 DSP 等方面的性能。在手机、电脑、云服务器上的 ARM 芯片,以往虽然看起来都是同样的架构,但却用着不同大小的寄存器。在 ARM v9 上,指令集首次得到了统一,开发者们的应用可以一次编译,在所有设备端运行。

让手机变成云超算?我们或许可以期待在骁龙 8 的手机上,未来会出现一些神奇的应用。
 
基于 ARM 架构,高通的 AI 算力目前已经覆盖家庭、工业、智慧城市物联网,端侧设备和自动驾驶,包括 IoT 终端、手机、PC、XR、汽车等等,面向不同场景和终端有不同的算力,同时又互相融合。

图片


不止于手机,高通的技术正面向不同应用场景「扩展 AI 性能」 ,先进的通讯技术和更强的端侧算力将重构人工智能应用的形态,在各类终端上,人工智能将无处不在。
  
高通的 AI 工程师:发表论文,著书立说

高通的 AI 技术宣传可能并不像英伟达、谷歌那么高调,但却实实在在地出现在我们手上,高通的研究者在学界也有很高的影响力。

近年来,高通 AI Lab 发表的学术论文越来越多,被顶会收录的研究,仅计算机视觉领域的就超过 20 篇。

这些技术被很快应用到了实践中,比如骁龙 8 的新能力,背景虚化 + 面部识别 + 姿态识别 + 手势识别的多神经网络识别,其中面部特征点多达 300 个:

图片


该技术来自于计算机视觉顶会 CVPR 2021 收录的一篇论文《Skip-Convolutions for Efficient Video Processing》。

在这篇文章中,高通 AI Lab 提出了名为 Skip-Convolutions(跳跃卷积)的新卷积层,在图像识别神经网络中替代所有常规卷积层后把视频流任务的计算量降低了 3-4 倍,而没有任何精度下降。

算法技术和芯片算力的提升,让骁龙 8 在实时的视频目标检测、图像识别任务中,可以同时跑多个 AI 模型,带来复杂的效果。

前几天 AI 圈内有一个新闻,也多少透露了一点高通在 AI 领域的领先水准。阿姆斯特丹自由大学助理教授、前高通 AI 研究中心研究员 Jakub Tomczak 在推特上公布了全新著作《深度生成模型》的进展,目前这本书已经正式出版。
 

图片


Tomczak 在高通 AI 研究中心任研究员时,曾在视频压缩和机器学习贝叶斯优化等方面发表过多项研究,被 CVPR、NeurIPS、ICCV 等顶尖学术会议收录。这本书中,他通过结合概率模型和深度学习来处理构建人工智能系统的问题。它超越了典型的预测模型,将监督学习和非监督学习结合在一起。由此产生的范式称为「深度生成模型」,它从生成视角感知周围的世界。

阿姆斯特丹大学机器学习研究主席、也是和高通有更深渊源的前高通技术副总裁 Max Welling 还为这本书写下了序言。《深度生成模型》旨在吸引对该领域感兴趣的学生、工程师和研究人员,还在 GitHub 上开放了相关内容的代码,引来机器学习社区的欢迎。

有学术范的 AI 研究员,创造的新技术才可以改变世界。高通在 AI 领域的故事,还在不断延伸。
入门高通
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

非监督学习技术

非监督式学习是一种机器学习的方式,并不需要人力来输入标签。它是监督式学习和强化学习等策略之外的一种选择。在监督式学习中,典型的任务是分类和回归分析,且需要使用到人工预先准备好的范例(base)。一个常见的非监督式学习是数据聚类。在人工神经网络中,自组织映射(SOM)和适应性共振理论(ART)则是最常用的非监督式学习。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

虚拟现实技术

虚拟现实,简称虚拟技术,也称虚拟环境,是利用电脑模拟产生一个三维空间的虚拟世界,提供用户关于视觉等感官的模拟,让用户感觉仿佛身历其境,可以及时、没有限制地观察三维空间内的事物。用户进行位置移动时,电脑可以立即进行复杂的运算,将精确的三维世界视频传回产生临场感。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

深度生成模型技术

深度生成模型基本都是以某种方式寻找并表达(多变量)数据的概率分布。有基于无向图模型(马尔可夫模型)的联合概率分布模型,另外就是基于有向图模型(贝叶斯模型)的条件概率分布。前者的模型是构建隐含层(latent)和显示层(visible)的联合概率,然后去采样。基于有向图的则是寻找latent和visible之间的条件概率分布,也就是给定一个随机采样的隐含层,模型可以生成数据。 生成模型的训练是一个非监督过程,输入只需要无标签的数据。除了可以生成数据,还可以用于半监督的学习。比如,先利用大量无标签数据训练好模型,然后利用模型去提取数据特征(即从数据层到隐含层的编码过程),之后用数据特征结合标签去训练最终的网络模型。另一种方法是利用生成模型网络中的参数去初始化监督训练中的网络模型,当然,两个模型需要结构一致。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

监督学习技术

监督式学习(Supervised learning),是机器学习中的一个方法,可以由标记好的训练集中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练集是由一系列的训练范例组成,每个训练范例则由输入对象(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

5G技术

第五代移动通信系统(5th generation mobile networks),简称5G,是4G系统后的延伸。美国时间2018年6月13日,圣地牙哥3GPP会议订下第一个国际5G标准。由于物理波段的限制,5G 的网络也将会与其他通信技术并用,包含长距离的其他传统电信波段。

视频目标检测技术

视频目标检测是从视频而不是图像中检测目标对象的任务。

OPPO机构

OPPO,成立于2004年,是一家全球性的智能终端和移动互联网公司,致力于为客户提供最先进和最精致的智能手机、高端影音设备和移动互联网产品与服务,业务覆盖中国、美国、欧洲、东南亚等市场。

www.oppo.cn
推荐文章
暂无评论
暂无评论~