Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

上交大新型SRAM存内计算架构「COMPASS」,开启类脑计算新时代

图片

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

团队信息:这一工作由上海交大先进计算机体系结构实验室蒋力教授和刘方鑫助理教授所在课题组(IMPACT)完成,同时也获得了上海期智研究院的支持。第一作者是博士生汪宗武。

会议介绍

MICRO 全称 IEEE/ACM International Symposium on Microarchitecture,与 ISCA、HPCA、ASPLOS 并称为体系结构「四大顶会」,囊括了当年最先进的体系结构成果,被视作国际前沿体系结构研究的风向标,见证了诸多突破性成果的首次亮相,包括谷歌、英特尔、英伟达等企业在半导体领域的多项技术创新。本次会议共收到投稿 497 篇,收录文章 113 篇,录取率为 22%。

近年来,类脑计算在人工智能领域迅速崛起,尤其是脉冲神经网络(SNN)的出现,为低能耗、高效能计算提供了新的可能。然而,现有的脉冲神经网络在追求高准确性的同时,往往会增加能量消耗和计算延迟,这使得其在边缘设备上的应用面临诸多挑战。为解决这一问题,最新研究提出了一种基于 SRAM 的存内计算(CIM)架构 ——COMPASS,为 SNN 在硬件加速器上的高效部署提供了全新方案。

类脑计算的挑战与突破

传统的深度神经网络(DNN)已经在计算机视觉自然语言处理语音识别等领域取得了卓越的成果,但其对计算资源的巨大需求使其在能量效率方面的表现不尽如人意。相比之下,SNN 利用二进制脉冲事件代替连续激活值,以事件驱动的信息处理方式显著降低了计算需求。然而,SNN 的优势在高时效性任务中变得性能低下,这也给 SNN 的硬件实现提出了新的挑战:如何在保持高能效的同时,减少计算延迟和内存占用?

为应对这些挑战,论文提出的 COMPASS 架构创新性地利用了输入脉冲的显式稀疏性和输出脉冲的隐式稀疏性。通过引入动态脉冲模式的推测机制,该架构不仅显著减少了冗余计算,还优化了硬件资源的利用效率。此外,COMPASS 还设计了一种适用于输入和输出脉冲的时间维度压缩技术,进一步降低了内存占用,实现了高效的并行执行。

图片

创新架构的技术细节

图片

COMPASS 架构的核心在于其基于 SRAM 的存内架构的高稀疏性利用。传统的 CIM 架构面临的一个主要挑战是脉冲的不规则性和时间依赖性,这使得高并行架构中高效利用脉冲稀疏性变得困难。为了克服这些挑战,研究团队提出了 COMPASS 架构。这一架构基于 SRAM 的 CIM 技术,旨在通过高效利用输入脉冲(显式)和输出脉冲(隐式)中的不规则稀疏性,来显著提高 SNNs 的计算效率。

COMPASS 利用 SNN 的脉冲稀疏性设计了动态脉冲投机模式,实现了对推理延迟的对数时间步压缩,从而减少了冗余计算,并降低了硬件开销。为了充分发挥 CIM 架构的并行计算能力,COMPASS 架构还通过引入自适应投机窗口调度和时间脉冲稀疏表示,优化了输入和输出脉冲的处理流程,进一步降低了内存占用,实现了并行执行。

性能评估与结果

表一:COMPASS 的计算和存储资源与基线硬件对比

图片

COMPASS 架构的性能评估结果令人瞩目。与现有的 SNN 加速器硬件实现相比,COMPASS 在端到端加速方面实现了 24.4 倍的提升,同时每次推理的能耗降低了 386.7 倍。这一结果不仅证明了 COMPASS 架构在处理 SNN 任务中的优越性,也展示了其在实际应用中的巨大潜力。

研究团队通过一系列实验对 COMPASS 的性能进行了详尽的分析。在与传统 DNN 和其他 SNN 模型的对比中,COMPASS 表现出了显著的性能优势,尤其是在处理复杂任务时,COMPASS 的低能耗特性尤为突出。这一成果表明,COMPASS 架构在实现高效、低能耗计算方面具有广阔的应用前景。

图片

图 1:(a) 吞吐量和 (b) 能源效率的性能比较。由于稀疏性利用率低,PTB-CIM 表现出与 Strawman 方案(没有利用稀疏性)相当的性能,而 COMPASS 在所有基准测试中都提高了吞吐量和能源效率。

前景展望

随着人工智能应用场景的不断扩展,尤其是在边缘计算设备中的应用,能效比成为衡量算法和硬件设计的重要指标。COMPASS 架构的提出为这一问题提供了全新的解决方案。未来,该架构有望在更多的实际场景中得到应用,包括物联网设备、自动驾驶、智能机器人等领域。

展望未来,研究团队计划进一步优化 COMPASS 架构,使其在更多的 SNN 模型上实现高效部署。同时,随着 SRAM 技术的不断发展,COMPASS 有望进一步降低能耗,并在更大规模的应用中发挥其独特优势。这一创新成果不仅为类脑计算的研究提供了新的思路,也为未来低能耗人工智能的发展奠定了坚实基础。

结语

COMPASS 架构的成功研发标志着类脑计算迈出了关键性的一步。通过高效利用脉冲稀疏性和时间压缩技术,COMPASS 不仅克服了传统 SNN 硬件实现的瓶颈,还为未来智能设备的低能耗计算提供了强有力的支持。在人工智能领域快速发展的今天,这一突破性的创新无疑将对未来计算架构的发展产生深远影响。

论文信息:Zongwu Wang, Fangxin Liu*, Ning Yang, Shiyuan Huang, Haomin Li and Li Jiang*. COMPASS: SRAM-Based Computing-in-Memory SNN Accelerator with  Adaptive Spike Speculation. Proceedings of the 57th IEEE/ACM International Symposium on Microarchitecture (MICRO'24). November 2024.(标 * 为通信作者)

产业Compass类脑计算MICRO
相关数据
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

脉冲神经网络技术

第三代神经网络,脉冲神经网络(Spiking Neural Network,SNN),旨在弥合神经科学和机器学习之间的差距,使用最拟合生物神经元机制的模型来进行计算。脉冲神经网络与目前流行的神经网络和机器学习方法有着根本上的不同。SNN 使用脉冲——这是一种发生在时间点上的离散事件——而非常见的连续值。每个峰值由代表生物过程的微分方程表示出来,其中最重要的是神经元的膜电位。本质上,一旦神经元达到了某一电位,脉冲就会出现,随后达到电位的神经元会被重置。对此,最常见的模型是 Integrate-And-Fire(LIF)模型。此外,SNN 通常是稀疏连接的,并会利用特殊的网络拓扑。

边缘计算技术

边缘运算(英语:Edge computing),又译为边缘计算,是一种分散式运算的架构,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理。边缘运算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。边缘节点更接近于用户终端装置,可以加快资料的处理与传送速度,减少延迟。在这种架构下,资料的分析与知识的产生,更接近于数据资料的来源,因此更适合处理大数据。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
推荐文章
暂无评论
暂无评论~