Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

墨芯稀疏化再添硕果——论文被SNN收录,参与ICML研讨会,并正式加入MLCommons联盟

近期,墨芯在稀疏化的学术与产业进程中频出硕果,论文《S4: a High-Sparsity, High-Performance AI Accelerator》被全球首个稀疏化技术权威学术研讨会Sparsity in Neural Networks(SNN)Workshop 2022收录,出席机器学习国际顶级会议ICML进行分享,并正式加入ML Commons联盟。一系列的活动与成绩,彰显了墨芯正在以全球稀疏化计算引领者身份,快速为AI计算带来颠覆式革新。

墨芯论文研究成绩斐然

Sparsity in Neural Networks(SNN)Workshop是全球首个对稀疏化进行跨学科研究的国际盛会,集合了神经网络学术界及产业界在深度学习稀疏化领域最顶级的科学家与从业者,组织者来自Facebook AI Research、UT Austin、MIT、Google Brain、DeepMind、UCLA等著名企业及研究机构。SNN Workshop 2022活动主题为Advancing Understanding and Practice,面向全球范围内征集优秀论文,历经两个月的严格筛选,墨芯《S4: a High-Sparsity, High-Performance AI Accelerator》论文,凭借技术的前瞻性、内容的严谨性、双稀疏化算法的独创性以及全球首款高达32倍稀疏率计算卡的商业落地应用,更好地平衡了精度与算力的关系等优势,在申请的数百篇论文中脱颖而出,获得收录。

《S4: a High-Sparsity, High-Performance AI Accelerator》论文主要有以下关键论点:

稀疏化已经成为进行AI推理计算时减少内存占用、I/O成本和计算工作负载的最具潜力的方法之一,并已获得业界广泛认可。虽然稀疏化计算技术不断进步,且可实现的稀疏倍率越来越高,但大多数计算平台并不支持高稀疏率的计算加速。市面上仅有NVIDIA A100支持2倍的稀疏张量加速。

墨芯基于Antoum®️芯片的S4计算卡是业界首款支持32倍稀疏张量运算的AI推理加速卡,同时实现稀疏神经网络的高模型精度和高硬件执行效率。实现结果表明,S4与国际头部主流AI推理卡相比具有三大优势,并取得了更好的整体性能表现:

  • 支持高达32倍的稀疏张量运算
  • 运行多个AI主流模型时,性能表现为国际大厂主流AI推理卡的6倍以上
  • 在精度无损的前提下,S4具备高算力、低功耗、高性价比的特点

S4计算卡最重要的特性是其原生支持稀疏化的张量表示。以不同的稀疏率运行CV和NLP的两个基本模型——ResNet-50和BERT时,S4表现出了更高算力。同时,在实际应用中,稀疏化模型剪枝比结构化模型剪枝可以更好地平衡精度与算力的关系。

墨芯的稀疏化算法和Antoum®芯片架构的软硬件协同设计,大大提高了S4的计算速度,实现高达数量级的算力提升,从而降低了总拥有成本(TCO)。

严恩勖博士,是S4论文的第一作者,现任墨芯首席科学家兼联合创始人,谈到撰写此论文的初衷时,他表示:“

我们要实现高倍率稀疏化计算,现有的硬件必须既要能实现高倍率稀疏化,又要能够支持大规模并行计算,然而市面上并没有这样理想的产品。于是,我们便开始从算法和软件出发,来设计相应的硬件和架构。特别是将我在稀疏化学术领域多年的潜心研究——独创的双稀疏算法,升级到计算层面,真正做到了算法与软硬件协同设计。我们做了大量的前期研究与实验,用数据和事实证明了我们所取得的骄人成绩。

《S4: a High-Sparsity, High-Performance AI Accelerator》的入选与发布,标志着墨芯背后的研发团队拥有全球最顶尖的研发实力,不仅站在了国际第一梯队,并且正在领跑全球稀疏化计算赛道。墨芯对稀疏化技术趋势的判断,以及对软硬一体协同优化的践行均得到了科学验证,符合神经网络学习发展趋势,并将为业界解决算力需求与算力供给之间的不平衡问题提供有效的解决方案。

墨芯参与ICML线下分享会

墨芯携此论文参加了机器学习国际顶级会议——国际机器学习大会(ICML)专门针对稀疏化的主题研讨会,以线下面对面交流的方式分享了墨芯在稀疏化领域的前沿研究及S4计算卡的产业化落地经验,获得业界一致好评,这也是墨芯稀疏化技术实力领先全球的又一次力证。

墨芯加入MLCommons联盟

墨芯,于2022年正式加入MLCommons联盟,这是一个非营利性机器学习开放组织,在全球享有盛誉,致力于为机器学习及人工智能领域提供权威的基准测试标准。墨芯加入,标志着墨芯作为稀疏化计算全球引领者的技术水平与产品实力,均已获得行业认可,与Google、Facebook、微软、Intel、阿里巴巴等AI领军企业站在同一舞台。将合作推动深度学习领域的技术创新,共享AI产业成果,加速AI及机器学习的技术产业化进程。

作为影响力最广的国际AI性能基准评测,MLCommons最新的MLPerf 2.1 Inference 测评结果即将发布。此次墨芯人工智能将携S4、S10与S30计算卡参与多项评测,与行业顶尖厂商同场角逐,墨芯人工智能将为业界带来怎样的颠覆式创新成果与惊喜?敬请持续关注墨芯的官网与微信号,获取官方最新信息!

如需了解更多论文相关信息,欢迎登录全球论文网站arXiv.org下载论文全文(https://arxiv.org/pdf/2207.08006.pdf),或登录SNN Workshop 2022官网查阅论文海报(http://www.sparseneural.net/accepted-papers)。

墨芯人工智能Moffett AI | 稀疏计算专栏
墨芯人工智能Moffett AI | 稀疏计算专栏

分享稀疏化计算实践与产业前沿,推动AI计算更快速、更精准、更绿色、更经济。

专栏二维码
产业
1
暂无评论
暂无评论~