产业资讯方案大厅机构大厅

寒武纪

Cambricon

人工智能硬件深度学习
http://www.cambricon.com

机构介绍

寒武纪科技是全球智能芯片领域的先行者,宗旨是打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片。公司创始人、首席执行官陈天石教授,在处理器架构和人工智能领域深耕十余年,是国内外学术界享有盛誉的杰出青年科学家,曾获国家自然科学基金委员会“优青”、CCF-Intel青年学者奖、中国计算机学会优秀博士论文奖等荣誉。 团队骨干成员均毕业于国内顶尖高校,具有丰富的芯片设计开发经验和人工智能研究经验,从事相关领域研发的平均时间达七年以上。 寒武纪科技是全球第一个成功流片并拥有成熟产品的智能芯片公司,拥有终端和服务器两条产品线。2016年推出的寒武纪1A处理器(Cambricon-1A)是世界首款商用深度学习专用处理器,面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备,在运行主流智能算法时性能功耗比全面超越CPU和GPU,与特斯拉增强型自动辅助驾驶、IBM Watson等国内外新兴信息技术的杰出代表同时入选第三届世界互联网大会评选的十五项“世界互联网领先科技成果”。目前公司与智能产业的各大上下游企业建立了良好的合作关系。在人工智能大爆发的前夜,寒武纪科技的光荣使命是引领人类社会从信息时代迈向智能时代,做支撑智能时代的伟大芯片公司。

作为全球智能芯片领域的先行者,寒武纪聚焦端云一体、端云融合的智能新生态,致力打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片,让机器更好地理解和服务人类。


公司创始人、首席执行官陈天石博士,在处理器架构和人工智能领域深耕十余年,是国内外学术界享有盛誉的杰出青年科学家,曾获2017年度CCTV科技创新人物、国家自然科学基金委员会“优青”、CCF-Intel青年学者奖、中国计算机学会优秀博士论文奖等荣誉。公司骨干成员均毕业于国内外顶尖高校,具有丰富的芯片设计开发经验和人工智能研究经验,从事相关领域研发的平均时间达九年以上。


公司在2016年推出的首款寒武纪1A处理器,已应用于数千万智能手机等终端设备中,入选了第三届世界互联网大会评选的十五项“世界互联网领先科技成果”。公司在2018年推出的思元100(MLU100)机器学习处理器芯片,运行主流智能算法时性能功耗比全面超越CPU和GPU。在2019年6月推出云端AI芯片中文品牌“思元”、第二代云端AI芯片思元270(MLU270)及板卡产品,处理非稀疏深度学习模型的理论峰值性能提升至上一代思元100的4倍。思元270入选第六届世界互联网大会领先科技成果,并为客户在智能视频分析、语音合成、推荐引擎、AI云等多个领域提供了高能效比的解决方案。


目前,寒武纪已与智能产业的各大上下游企业建立了良好的合作关系,在未来,寒武纪将继续秉承开放共赢的姿态,与全球诸多合作伙伴一起共建智能新生态,用人工智能芯片技术的突破与创新,驱动人工智能计算力引擎。

产品及解决方案

寒武纪思元100智能加速卡

地产

思元100是寒武纪推出的第一款智能处理板卡产品,基于寒武纪MLUv01架构。支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用。思元100加速卡的INT8理论峰值性能为32TOPS,在稀疏模式下等效理论峰值性能为128TOPS,FP16理论峰值性能为16TFLOPs,稀疏模式下等效理论峰值性能为64TFLOPs。思元100加速卡还搭载多种容量的256bit DDR4 ECC内存,可满足各类推理场景的云端计算需求。

MLU100

科研教育健康医疗工业制造交通运输与物流

寒武纪 MLU100 智能处理卡是寒武纪推出的第一款通用智能处理卡,搭载了MLU100芯片,为云端推理提供强大的运算能力支撑。与传统架构处理器相比,MLU100在处理人工智能任务时可获得巨大的性能功耗比提升,是真正适合人工智能的处理器。MLU100智能处理卡的等效理论峰值运算能力166.4 TOPS(INT8),支持最高16GB的DDR4内存容量,并具备ECC数据校验功能。 MLU100具备通用性好、高能效与高可靠性、支持稀疏化与完善的软件开发环境等核心特性,具有广泛的应用领域。

Cambricon-X

通信及信息技术

解决: 1.有限规模的硬件和任意规模的算法的矛盾 2.结构固定的硬件和千变万化的算法的矛盾 3.能耗受限的硬件和精度优先的算法的矛盾。

思元100云端AI芯片

通信及信息技术

寒武纪思元100智能处理卡搭载了1颗寒武纪思元100芯片,为云端推理提供强大的运算能力。与传统架构处理器相比,MLU100在处理人工智能任务时可获得巨大的性能及能效比提升,是真正适合人工智能的处理器。 思元100智能处理卡的等效理论峰值运算能力128 TOPS(INT8),采用被动散热方式,可通过单槽位的PCIe Gen3 x16接口集成于现有的各类型服务器和数据中心中。MLU100智能处理卡支持最高16GB的DDR4内存容量,并具备ECC数据校验功能。

寒武纪1H双核智能终端处理器

通信及信息技术

寒武纪1H智能处理器是寒武纪第二代高性能、低功耗的智能终端处理器IP产品,采用定制化的低功耗处理器架构,与传统处理器和图形处理器相比,可显著提升深度学习的处理速度和能效,可广泛应用于计算机视觉、语音识别、自然语言处理、智能物联网等领域,适用于各类低功耗智能终端芯片。

思元270

通信及信息技术

思元270芯片集成了寒武纪在处理器架构领域的一系列创新性技术,理论峰值性能达到每秒128万亿次人工智能基本运算(INT8);同时兼容INT4和INT16运算,理论峰值分别达到每秒256万亿次和64万亿次;思元270采用寒武纪公司自主研发的MLUv02指令集,可支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用。

中科寒武纪MLU100智能处理卡

大数据技术计算机视觉通信及信息技术

寒武纪MLU100智能处理卡搭载了1颗寒武纪MLU100芯片,为云端推理提供强大的运算能力。与传统架构处理器相比,MLU100在处理人工智能任务时可获得巨大的性能及能效比提升,是真正适合人工智能的处理器。 MLU100智能处理卡的等效理论峰值运算能力128 TOPS(INT8),采用被动散热方式,可通过单槽位的PCIe Gen3 x16接口集成于现有的各类型服务器和数据中心中。MLU100智能处理卡支持最高16GB的DDR4内存容量,并具备ECC数据校验功能。

中科寒武1H双核智能终端处理器

语音识别深度学习自然语言处理计算机视觉通信及信息技术

寒武纪1H智能处理器是寒武纪第二代高性能、低功耗的智能终端处理器IP产品,采用定制化的低功耗处理器架构,与传统处理器和图形处理器相比,可显著提升深度学习的处理速度和能效,可广泛应用于计算机视觉、语音识别、自然语言处理、智能物联网等领域,适用于各类低功耗智能终端芯片。

寒武纪软件平台

深度学习机器学习通信及信息技术

寒武纪软件栈已经支持 TensorFlow、Caffe 和 MXNet 等深度学习框架,让广大开发者更快获得 AI 智能芯片的计算能力。 未来寒武纪平台还将推出安卓和苹果系统的软件 API。 寒武纪软件栈兼容主流深度学习框架,允许用户在其上开发稀疏和量化模型,并在其上直接生成寒武纪模型,通过 AI 芯片处理获得更高效率。 寒武纪软件栈中包含了大量面向开发者的实用工具,在寒武纪性能调优和功能调试工具包上,可以给出模型,让系统自动预测优化前后的性能。

专业商用深度学习处理器IP

深度学习机器学习通信及信息技术轻工制造

其新一代智能处理器 IP 产品,包括面向低功耗场景视觉应用的寒武纪 1H8、拥有更广泛通用性和更高性能的寒武纪 1H16,以及面向智能驾驶领域的寒武纪 1M。 与寒武纪 1A 相比,新一代智能处理器在功耗、能效比、成本开销等方面进行了优化,性能功耗比再次实现较大提升,适用范围覆盖了图像识别、安防监控、智能驾驶、无人机、语音识别、自然语言处理等各个重点应用领域。

寒武纪高性能机器学习处理器芯片

AI基础设施机器学习轻工制造通信及信息技术

其 MLU 系列机器学习处理器将其产品的神经网络加速拓展到机器学习,以适应更多的运算任务。 寒武纪 MLU 100 与 MLU 200 高性能芯片都将支持多种机器学习推理和训练任务的加速,前者偏重推理,后者偏重训练。此外,MLU 100 面向中小型服务器,而 MLU200 则面向企业级人工智能研发中心。

商用深度学习处理器IP

深度神经网络计算机视觉时间递归神经网络自然语言处理卷积神经网络语音识别通信及信息技术

该产品是专门针对人工智能深度学习而设计的处理器,在图像、语音识别领域比传统处理器性能至少提高两个数量级,集成度也是传统处理器的数倍,让手机等移动设备搭载人工智能芯片成为可能,是市场上最为强大的神经网络处理器。可支持从上古时代的模型,到现代最新的模型。支持稀疏化神经网络,到半精度处理。具备: 1. 低功耗嵌入式终端的本地智能处理; 2. 理论峰值性能@ 1GHz:512 GFlops(FP16半径度浮点);2TFlops(对稀疏神经网络的等效理论峰值,1A-v1); 3.最卓越的完备性和前瞻性: 1)支持视觉、语音、自然语言处理等多种职能任务; 2)支持各类 CNN、DNN、RNN、LSTM、SOM 等多样化的模型; 3)支持 deconv、local connection、depthwise conv 等多样化的模型; 4)支持稀疏化网络,支持 FP16、INT8 运算以及 1bit 权重。 其面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备,在运行主流智能算法时性能功耗比全面超越 CPU 和 GPU。