Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

引领稀疏化计算,墨芯入选机器之心年度AI技术趋势报告

稀疏化是AI计算的未来

今天,墨芯人工智能联合权威媒体机器之心,发布稀疏化计算专栏。


墨芯人工智能创立于2018年,是稀疏化计算的全球领导者。墨芯将在该专栏中,与您分享稀疏化计算的产业前沿洞察,探索我们如何帮助企业在数字化转型中,拥有更高效、更精准、更经济、更绿色的AI算力。


在开篇,我们会简单介绍稀疏化是什么,为什么它是AI计算的未来。本文还会介绍墨芯人工智能在此领域的最新产业实践——正因为在稀疏化在理论和产业实践上的积极探索,墨芯入选机器之心《2021-2022年度AI技术趋势报告》。


人工智能“动脑”,背后算力消耗惊人


人类一直梦想着能制造出一台“会思考”的机器。


2016年,阿尔法围棋(AlphaGo)成为第一个战胜人类围棋世界冠军的人工智能机器人,意味着人工智能可以匹敌、甚至超越人类智慧。


但它做到这一点,耗费惊人。


2017年10月,DeepMind团队公布了最强版阿尔法围棋AlphaGo Zero。据估算,AlphaGo Zero整体训练过程使用了数千个TPU,算力成本高达3500万美元,且能耗巨大,约等同于12760个人类大脑3天不眠不休所耗费的能量。


窥一斑而知全豹:AI时代对于算力的需求是空前的。诺贝尔经济学奖获得者William D. Nordhau提出:“算力是设备每秒可处理的信息数据量”。这里所说的设备,包括算力实现的硬件载体,即各类计算芯片。


通常芯片算力性能的提升遵循芯片业黄金法则摩尔定律:每18个月左右芯片算力翻1倍。而AI时代的算力需求增长远高于这个速度。埃隆·马斯克创立的Open AI称,自 2012 年以来,在大型 AI 训练中用到的计算量每3.5个月就翻1倍。

“相比云计算和大数据等应用,AI对算力的需求几乎无止境。”中国工程院院士、浪潮集团首席科学家王恩东指出。由此可知,遵循摩尔定律的算力发展,远远无法满足AI时代的算力需求,这已是业界共识。

一个聪明的解决方案

为满足AI应用所需要的算力,业界需要突破摩尔定律,从超越芯片硬件本身来找寻高性能计算解决方案。不仅如此,我们还需降低算力大幅增长带来的负面效应,如高成本和高能耗等,避免给地球带来沉重负担。从算法入手来解决算力问题,如稀疏化计算是其中最具潜力的解决方案。


稀疏化算法技术诞生于美国1950年代,近年来,AI向大模型的发展趋势越来越确定,这也让稀疏化的地位快速提升。


AI大模型将重新定义现有产业模式和标准。AI应用场景过往具有“碎片化”特征,即针对不同的应用场景要开发不同的模型。未来,各垂直领域只需基于一个大模型,对其参数进行微调,即可让AI落地多个场景。


大模型虽然是大势所趋,但由于它对算力等要求很高,目前在产业界落地挑战很大。稀疏化计算,不仅能让AI大模型实现商业化落地,而且能够以超低能耗、超低成本做到这一点。


2022年春,谷歌大脑负责人Jeff Dean也指出了稀疏化在AI计算未来发展中的重要性。他撰文回顾了人工智能深度学习的黄金十年,强调了从软件和算法出发,软硬件融合发展是核心,并判断未来三个富有潜力的研究方向为:稀疏模型、自动化机器学习(AutoML)和多任务训练。


稀疏化的优势已被业界主流认识到,那么稀疏化的技术原理是怎样的?


什么是稀疏化


稀疏化计算的技术原理是指在原有AI计算的大量矩阵运算中,将含有零元素或无效元素剔除,以加快计算速度。比如在人脸识别的场景中,传统算法会将图片中的每一个元素输入模型,然后计算结果。而稀疏化计算,会先在图片中找出人脸相关的有效元素,然后输入模型得到结果。


简而言之,它能让神经网络模型消减冗余和重复的内容,减少运算压力,通过改变模型的特性,进而大幅提高算力,降低能耗。


新锐创企墨芯引领稀疏化技术


2022年4月27日,墨芯作为稀疏化计算领导企业,凭借领先研发优势,以及产业化取得的积极进展,入选机器之心《2021-2022年度AI技术趋势报告》。


《2021-2022年度AI技术趋势发展报告》由国内权威人工智能技术媒体机器之心最新发布,系统介绍了人工智能领域下的不同技术分支,并以定性分析的方法讨论了各分支技术当时所处的发展阶段、瓶颈以及未来的发展方向。报告中,稀疏化算法技术被列为年度AI技术趋势TOP3,报告介绍了行业中多个主流厂商在此领域的探索。墨芯人工智能与英伟达、华为和百度等公司被收录其中,并居于领先地位。


墨芯首创32倍稀疏率张量运算核心,为企业降本增效

从全球顶尖稀疏化算法技术走向商业落地,墨芯致力于推动AI计算产业前沿。


2020年底,产业界已经有2倍稀疏率的芯片和计算卡诞生,但现有主流芯片架构局限,导致了并无高稀疏率的计算产品诞生,也就无法在性能上往10倍、20倍去突破。由于市面上的芯片不能很好支持稀疏化算法,墨芯选择自主研发能为之提供底层技术的高稀疏率算力芯片。


墨芯首创高达32倍稀疏率张量运算核心,独创基于双稀疏技术研发的AI计算卡,相较于行业其他产品,墨芯的稀疏化计算卡能提供超高性能、极低TCO(Total Cost of Ownership ,即总拥有成本)。

基于墨芯首颗芯片Antoum®️打造的SparseOne™️ S100和SparseMegatron™️ S300是全球率先支持高达32倍稀疏率的AI计算卡。能效比相较于业界主流产品提高了1个数量级,S300计算ResNet50标准模型的算力超过90000 FPS。


由于算力极大提升,S100和S300能助力公有云和私有云服务商,将TCO降低10倍以上,将同等运算量的耗电量降至1/10。

墨芯SparseRT™️软件开发环境可以高效支持通用的AI编程框架,如TensorFlow、PyTorch、ONNX和MXNet等。用户可以在熟悉的TensorFlow或PyTorch环境里进行开发之后再进行迁移与交付。


目前,墨芯的主要客户面向数据中心AI推理应用,在互联网、运营商、安防、生物制药和FinTech等场景下已有了具体的实践。


墨芯秉持科技向善。墨芯认为,稀疏化不仅能帮助企业在向AI转型中降本增效,在更大意义上,还能为实现碳达峰和碳中和的战略目标贡献积极力量。


在接下来的专栏中,墨芯首席科学家严恩勖博士将与您分享更多他对AI计算过去、现在与未来的思考,我们还将与您分享更多稀疏化计算产品产业落地的最新消息,敬请关注。


墨芯人工智能Moffett AI | 稀疏计算专栏
墨芯人工智能Moffett AI | 稀疏计算专栏

分享稀疏化计算实践与产业前沿,推动AI计算更快速、更精准、更绿色、更经济。

专栏二维码
产业
2
暂无评论
暂无评论~