Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

寒武纪发布边缘AI芯片思元220,性能优于英伟达Xavier NX两倍

<mark data-type=institutions data-id=9dcd5943-3120-4910-9c86-e7259a164965>寒武纪</mark>发布边缘AI芯片思元220,性能优于英伟达Xavier NX两倍


按照寒武纪公布的参数,思元 220 参数性能比肩英伟达去年发布的 Jetson 系统级模块——AGX Xavier 和上周发布 Jetson Xavier NX。

在功耗上胜出 AGX Xavier,在计算速度上优于 Xavier NX。

11 月 14 日机器之心消息,寒武纪副总裁刘道福在深圳发布思元系列边缘端 AI 芯片「思元 220」和思元 220-M.2 边缘加速卡。

思元 220 的问世, 标志着寒武纪已经具备了从终端 (寒武纪 1A、1H、1M 处理器 IP)、边缘端 (思元 220 芯片) 到云端 (思元 100、思元 270 芯片) 完整的智能芯片产品线。

<mark data-type=institutions data-id=9dcd5943-3120-4910-9c86-e7259a164965>寒武纪</mark>发布边缘AI芯片思元220,性能优于英伟达Xavier NX两倍


最新发布的思元 220 芯片采用了寒武纪在处理器架构领域的一系列创新性技术——寒武纪最新一代智能处理器 MLUv02,实现:

最大 32TOPS(INT4)算力,而功耗仅 10W。

对比 英伟达在去年发布的 Jetson 系统级模块——AGX Xavier 和上周发布 Jetson Xavier NX。

AGX Xavier 有 10W/15W/30W 三种选择,神经网络运算输出为 32TOPS,可应付多达四路的 HEFC 4K 、60fps 视频流。在功耗上有待进一步提升。

而就在上周,英伟达进一步推出 Jetson 的最新成员 Jetson Xavier NX,号称「全球最小边缘超算」。

可提供高达 14 TOPS(功耗为 10W 时)或 21 TOPS(功耗为 15W 时)的性能,能够并行运行多个神经网络,并在与 Nano 同样尺寸(70x45mm)的小巧外形中同时处理来自多个高分辨率传感器的数据。

Xavier NX 将于明年 3 月开始发售,价格 399 美元。虽主打边缘超算,但这个价格有些让人望而却步。

说回思元 220 ,据介绍,它可提供 16/8/4 位可配置的定点运算,客户可以根据实际应用灵活的选择运算类型来获得卓越的人工智能推理性能。

在软件方面,通过端云一体的软件平台,思元 220 继续支持寒武纪 Neuware 软件工具链,支持业内各主流编程框架,包括 Tensorflow,Caffe,mxnet,以及 pytorch 等。

<mark data-type=institutions data-id=9dcd5943-3120-4910-9c86-e7259a164965>寒武纪</mark>发布边缘AI芯片思元220,性能优于英伟达Xavier NX两倍


思元 220 是一款专门用于深度学习的 SOC 边缘加速芯片,采用 TSMC 16nm 工艺,它具有高算力,低功耗和丰富的 I/O 接口。

<mark data-type=institutions data-id=9dcd5943-3120-4910-9c86-e7259a164965>寒武纪</mark>发布边缘AI芯片思元220,性能优于英伟达Xavier NX两倍


基于思元 220,寒武纪前期面向市场推出小尺寸的 M.2 加速卡,未来会推出更高算力的产品形态。

<mark data-type=institutions data-id=9dcd5943-3120-4910-9c86-e7259a164965>寒武纪</mark>发布边缘AI芯片思元220,性能优于英伟达Xavier NX两倍


思元 220-M.2

思元 220-M.2 边缘加速卡在尺寸为 U 盘大小的卡片上实现了 16TOPS(INT4)或 8TOPS(INT8)的算力。客户可以通过标准的 M.2 接口快速部署到已有的业务中实现业务的智能升级和边缘加速解决方案。

寒武纪表示,面向未来,针对不同的场景,包括边缘计算、自动驾驶车载计算、训练等场景。寒武纪将持续投资,推出更多的 AI 处理器,面向全场景持续提供更先进灵活、快速高效、性能卓越 AI 算力产品及服务。

1 边缘端为何重要

活动现场,寒武纪副总裁刘道福认为:相比数据中心计算或者说云计算边缘计算有几个优势:

1)大幅降低传输成本。

在很多如电力、能源等工业领域,网络条件并不好,并且通讯基础设施的改造成本很高,因此数据直接在边缘进行处理,处理完的数据直接用于边缘决策,或者有效信息传回云端集中决策,这都可以减少传输成本。

2)大幅降低延时。

边缘计算往往具有实时的要求,因为要对各种设备进行实时决策,而传统的云计算,由于网络延时,很难做到实时。

3)保护数据隐私和安全。

边缘计算可以无需将数据或者原始数据传回云端,从而可以大大保护数据的安全和隐私,减少数据泄漏。

在昨天的报道《继英伟达最小边缘超算,英特尔再推 10 倍提升 VPU,终端 AI 芯片创业压力加剧》里,我们也谈到,边缘智能,作为人工智能的最后一公里,很长一段时间里被创业者视为得以绕开巨头打压的蓝海市场,但今年市场被催熟的趋势明显,英特尔Nervana、英伟达Jeston系列、以及谷歌Coral和华为鲲鹏等巨头逐步进场收割,AI芯片创业生态竞争加剧。

2 云边终三端布局

除了目前云边结合的思元系列,寒武纪在更早推出的是终端产品线:终端 IP 处理器系列。

从第一代产品,2016 年推出的首个商用深度学习处理器 Cambrion-1A,到 17 年面向计算机视觉领域专用的二代处理器 Cambricon-1H(Cambricon-1H8、Cambricon-1H16),再到延续了前两代产品完备性优点的第三代最新产品,面向本地训练的 Cambricon-1M。

采用 7nm 台积电工艺的 Cambricon-1M,性能十倍超越于已被广泛使用各大移动手机终端的 Cambricon-1A。可以实现 5TOPS/W 能效比,单个处理器核即可支持 CNN、RNN、SOM 等多样化的深度学习模型,更进一步支持 SVM、k-NN、k-Means、决策树等经典机器学习算法。

科大讯飞就曾在发布会上披露,寒武纪处理器在语音智能处理的测试结果,显示出了能耗效率上的优越性。其领先于竞争对手的云端 GPU 方案至少 5 倍,语音本地识别准确率相对于传统处理器也有 9.8% 的提升。

IP 处理器成名的寒武纪在终端产品不断成熟之后,紧接着推出云端芯片,本次思元系列的前两款产品:思元 100 和思元 270。

<mark data-type=institutions data-id=9dcd5943-3120-4910-9c86-e7259a164965>寒武纪</mark>发布边缘AI芯片思元220,性能优于英伟达Xavier NX两倍


回顾这两款云端芯片在实际运用中,均表现出如下几点共同的优势:

  • 1)作为通用处理器,支持各类深度学习技术,支持多模态智能处理(视觉、语音和自然语言处理),应用领域广泛;
  • 2)从指令集和架构角度来看,相比于 GPU,对于在深度学习人工智能场景中表现出了更高的效能比;
  • 3)配套软件开发环境完善,用户体验良好;
  • 4)为「端云一体「策略而开发的最佳执行者。

此次发布的思元 220,更是旨在弥补市场内边缘端加速方案的空白而存在,同时也彻底完善了寒武纪产品线中边缘端芯片的空白。

寒武纪借助由于人口因素带来的数据优势,更加擅长于训练,因此多款芯片均可以看出技术优势带来的侧重点在于训练。

目前寒武纪无论是云端,终端,还是边缘芯片,都采用统一的处理器架构和指令集,以及统一的软件栈。

这三个领域的生态可以相互促进,形成正循环。云端提供了完整的开发,调试,调优的软件,云端开发好的程序,可以很方便快速的部署到终端和边缘,解决终端和边缘开发难,调试难,调优难的问题,而终端和边缘,可以积累大量的客户和开发者,反哺于云端生态,最终实现云,边,端生态的繁荣。

产业寒武纪智能芯片深度学习
相关数据
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。

https://www.huawei.com/cn/
科大讯飞机构

科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,长期从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究并保持了国际前沿技术水平;积极推动人工智能产品研发和行业应用落地,致力让机器“能听会说,能理解会思考”,用人工智能建设美好世界。2008年,公司在深圳证券交易所挂牌上市。

http://www.iflytek.com
寒武纪机构

寒武纪科技是一家AI芯片研发商。致力于打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片,同时还为用户提供IP授权、芯片服务、智能子卡和智能平台等服务。

www.cambricon.com
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

边缘计算技术

边缘运算(英语:Edge computing),又译为边缘计算,是一种分散式运算的架构,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理。边缘运算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。边缘节点更接近于用户终端装置,可以加快资料的处理与传送速度,减少延迟。在这种架构下,资料的分析与知识的产生,更接近于数据资料的来源,因此更适合处理大数据。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
推荐文章
暂无评论
暂无评论~