邱丽婷作者

依图科技高调杀入AI芯片领域:人工智能老兵的新想法

在“阿尔法狗”(AlphaGo)打败人类围棋顶尖高手之后,AI彻底火了,有关这方面的讨论从那时候起就一直不绝于耳,各种相关的AI应用也层出不穷。现在遍地开花的人脸识别、图像识别和语音识别等应用背后都有AI的身影,各种厂商也聚焦在这些市场提供各种差异化的AI方案。

如被称为国内“AI四小龙”之一的依图科技就凭借在计算机视觉语音识别、语义理解和智能决策等多方面的技术积累,将人工智能技术注入到了智能安防、科技金融、智能医疗、智慧城市、新零售和智能制药等多个领域,推出了全球领先的创新技术和产品。人工智能应用也在依图等厂商的的推动下迅速发展,这也带动了后面相关芯片需求的发展。

根据Gartner的预测数据,全球人工智能芯片市场规模将在未来五年内呈现飙升,从2018年的42.7亿美元成长至343亿美元,增长超过7倍。相关的芯片也从早期的CPU、GPU、FPGA发展到现在针对特殊应用开发的客制化AI芯片。尤其是后者,更是成为最近这些年产业不可逆转的潮流。

从GPU、FPGA到专用AI芯片的演变

人工智能的发展早期,市场上都是选用CPU、GPU和FPGA等芯片作为人工智能应用的“动力”来源,但随着终端市场的发展,这些芯片的瓶颈开始凸显:

如CPU虽然能够为人工智能提供适合的算力、价格、功耗和时间,但因为AI的许多数据处理涉及矩阵乘法和加法,这并不是CPU所擅长的;GPU方面,虽然他们也是为了应对图像处理中的大规模并行计算处理而生的,但因为其硬件结构方面的局限性,使得即使他们在人工智能训练端如此重要,也还是有不少厂商尝试寻找新的替代空间;FPGA也因为基本单元的计算能力有限,速度和功耗方面也略显不足,再加上价格昂贵,在市场上也颇受争议。于是拥有成本、性能和功耗等优势的专门定制AI芯片就开始成为了市场追逐的目标。

这不但推动了一大波初创公司的诞生,很多做软件和算法的公司也都先后投身其中。

在前者方面,国内的寒武纪地平线和比特大陆都是先锋。以寒武纪为例,他们在2016年推出了世界首款终端人工智能专用处理器“寒武纪 1A”处理器,并已应用于数千万智能手机中。2018年,寒武纪推出了MLU100机器学习处理器芯片。按照他们的说法,这个昔年的运行主流智能算法时性能功耗比全面超越CPU和GPU。他们新一代的芯片最近也将浮出水面。

后者方面,谷歌和亚马逊是当中的先行者。据谷歌介绍,他们设计的、专门用于神经网络工作负载的矩阵处理器TPU可以极快地为神经网络处理大量的乘法和加法运算,并且耗电量显著降低,占用的物理空间更小。更重要的一点是通过其脉动阵列架构设计大幅度缓解了冯·诺依曼瓶颈;亚马逊AWS部门也通过其定制设计的机器学习推理芯片Inferentia为客户提供数百 TOPS(每秒万亿次运算)推理吞吐量,以允许复杂模型能够进行快速预测。能以极低成本交付高吞吐量、低延迟推理性能。

对于前者来说,因为AI市场潜力巨大,他们做芯片去分一杯羹无可厚非。但对于后者来说,这当中的意义更是巨大。一方面是因为他们拥有了庞大的客户,加入了自研芯片无疑可以降低他们的成本。另一方面,自研的AI芯片在性能和功耗上也有很大的提升空间,厂商甚至可以做一些差异化的设计,提高其竞争力,这也是那么多系统厂商进入这个市场的原因。

依图科技则是这个市场的另一大玩家。

人工智能“老兵”的新疆界

和现在的一大波人工智能的新玩家相比,成立于2012年的依图科技是不折不扣的老兵。在创始人朱珑博士和林晨曦的领导,以及公司员工的脑力下,依图科技人脸识别语音识别等多个领域积累了深厚的技术,公司也在多个市场攻城拔寨。这也帮助公司在一轮轮融资中,把市值推高,也让公司创始人有底气说出了”我们很贵,别人买不起“这样的豪言。

而这个主打机器视觉,以“拓展人工智能新疆界”为Slogan的企业不满足于此,他们正在横向和纵向拓展他们的疆界,而芯片就是他们的目标。按照依图的想法,把握住高集成度, 坐上数据、算法、算力这三驾马车,顺利走好AI芯片这条道路,这就是他们的目标。

基于此,依图发布了云端深度学习推理定制化SoC芯片questcore™

据介绍,依图科技的这款专为计算机视觉领域分析任务推出的芯片是基于自研的芯片架构打造的,它能高效适配各类深度学习算法(包括TensorFlow、PyTorch 等主流深度学习框架),在保持极低功耗的同时能大幅提升计算力,模型兼容性好,可扩展性高,无缝接入现有生态。

另外,questcore™自带的网络支持模块以及对虚拟化和容器化的支持,能将AI云的弹性计算和调度提升一个量级,这可以带来能耗比的大幅提升。能够充分发挥依图世界级算法优势。依图方面强调,在同等功耗下,他们的questcore™芯片能提供市面现有同类主流产品 2~5 倍的视觉分析性能。

为了实现其“极智”目标,依图方面强调,他们从现在开始会在AI芯片和智能硬件垂直发力。

按照依图的了解,在“算法定义芯片”的时代,算法即芯片,以 AI 为中心来思考架构能为芯片设计带来无限的想象空间,而算法则成为在这广袤空间中探寻搜索的指南针,拥有该领域知识的顶级算法厂商在智慧芯片和智能计算革命中开始发挥举足轻重的作用。

又因为依图 questcore™作为服务器芯片可以独立使用,有助于完善中国IC产业生态。这对于国内的人工智能产业乃至整个集成电路产业来说,也是一大幸事。

依图此次也同时发布了基于questcore™打造的原子服务器,一台服务器提供的算力与 8 张英伟达P4卡服务器相当,而体积仅为后者的一半,功耗不到20%。这意味着,这样一台单手可持的小小服务器,就能驱动一条主干道、一整个小型园区所需的智能算力。

依图方面进一步指出,questcore™与依图世界级算法结合,构成软硬件一体化的多元产品和丰富解决方案,将依图研发团队的先进算法和工程团队在智能安防、智能医疗、智慧零售和 AI CITY 等多个人工智能行业应用场景的实践经验相结合,能为客户实现更大价值。

未来无限美好,但仍需谨慎

集成电路是 20 世纪最伟大的发明,而人工智能则是 21 世纪人类的希望。从依图看来,在没有先例可循的智能时代,中国人工智能创业公司与世界巨头站在同一起跑线上,完全有机会成为新时代全球领先的全栈智能解决方案提供商。依图将立足“算法+芯片+数据智能”的极智战略,深入行业,降低人工智能应用落地和推广成本,赋能行业,长期持续地为社会做出积极贡献,与合作伙伴一起,共同推动中国智能产业发展,构建融合创新的智慧生态。

但我们也应该冷静看到,在全民欢呼背后,还有一些问题值得我们关注。就拿AI芯片领域来说,杜克大学教授陈怡然在之前曾提到,AI芯片在设计方面这几大挑战:

杜克大学教授陈怡然就曾提到,AI芯片在设计方面有几大挑战:

第一是大容量存储和高密度计算,当神经深度学习网络的复杂度越来越高的时候,参数也会越来越多,怎么处理是一大难题;

第二个挑战是要面临特定领域的架构设计,因为场景越来越丰富,这些场景的计算需求是完全不一样的。怎么样通过对于不同的场景的理解,设置不同的硬件架构变得非常重要;

第三个挑战是芯片设计要求高,周期长,成本昂贵。从芯片规格设计、芯片结构设计、RTL设计、物理版图设计、到晶圆制造、测试封装,需要2到3年时间,这段时间里软件会快速发展,算法也在快速更新,芯片如何支持这些更新也是难点;

第四个挑战是架构及工艺。随着工艺不断的提升,从90纳米到10纳米,逻辑门生产的成本到最后变得饱和。也许在速度、功耗上会有提升,但单个逻辑生产的成本不会再有新的下降。这种情况下如果仍然用几千甚至上万个晶体管去做一个比较简单的深度学习逻辑,最后在成本上是得不偿失的;

虽然依图在软件和算法领域独步天下,他们这些软硬结合的想法也能让人遐想连篇,但对于在芯片这个全新领域,依图还是新兵,未来即使商机无限,但也困难重重。

但正如依图科技创始人朱珑所说:“科技进步极大降低了创新所需的经济门槛,但是伟大所需的精神门槛——勇气,从来没有降低过”。换句话说,为理想,没有什么不可以。

半导体行业观察
半导体行业观察

最有深度的半导体新媒体,实时、专业、原创、深度,30万半导体精英关注!专注观察全球半导体最新资讯、技术前沿、发展趋势。

产业AI芯片依图科技
相关数据
AWS机构

亚马逊网络服务系统(英语:Amazon Web Services,缩写为AWS),由亚马逊公司所创建的云计算平台,提供许多远程Web服务。Amazon EC2与Amazon S3都架构在这个平台上。在2002年7月首次公开运作,提供其他网站及客户端(client-side)的服务。截至2007年7月,亚马逊公司宣称已经有330,000名开发者,曾经登录过这项服务。

相关技术
亚马逊机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
依图科技机构

依图科技致力于人工智能创新性研究,是全球唯一获得美国国家标准技术局(NIST)、美国国家情报高级研究计划局(IARPA)两项人脸识别世界冠军的企业,在安防、医疗、金融、智慧城市、新零售、芯片等领域推出全球领先的创新技术和产品。 依图科技是国内的最大智能安防服务提供商,是破案最多、覆盖省份最多、服务警种最多的人工智能安防平台;依图是智能医疗领域领军企业,提供全球领先的AI影像辅助诊断系统、AI儿科临床辅助诊断系统和医疗大数据智能平台;依图是智能金融领域市场占有率最高的企业, 2016年全球首推刷脸ATM机,开创无卡交易的金融时代。

https://www.yitutech.com/
寒武纪机构

寒武纪科技成立于2016年3月,是全球智能芯片领域的先行者,宗旨是打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片。公司创始人、首席执行官陈天石教授,在处理器架构和人工智能领域深耕十余年,是国内外学术界享有盛誉的杰出青年科学家,曾获国家自然科学基金委员会“优青”、CCF-Intel青年学者奖、中国计算机学会优秀博士论文奖等荣誉。团队骨干成员均毕业于国内顶尖高校,具有丰富的芯片设计开发经验和人工智能研究经验,从事相关领域研发的平均时间达七年以上。寒武纪科技是全球第一个成功流片并拥有成熟产品的智能芯片公司,拥有终端和服务器两条产品线。2016年推出的寒武纪1A处理器(Cambricon-1A)是世界首款商用深度学习专用处理器,面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备,在运行主流智能算法时性能功耗比全面超越CPU和GPU,与特斯拉增强型自动辅助驾驶、IBM Watson等国内外新兴信息技术的杰出代表同时入选第三届世界互联网大会评选的十五项“世界互联网领先科技成果”。目前公司与智能产业的各大上下游企业建立了良好的合作关系。在人工智能大爆发的前夜,寒武纪科技的光荣使命是引领人类社会从信息时代迈向智能时代,做支撑智能时代的伟大芯片公司。

http://www.cambricon.com/
地平线机构

地平线作为嵌入式人工智能全球领导者,致力于提供高性能、低功耗、低成本、完整开放的嵌入式人工智能解决方案。面向智能驾驶、智能城市和智能商业等应用场景,为多种终端设备装上人工智能“大脑”,让它们具有从感知、交互、理解到决策的智能,让人们的生活更安全、更便捷、更美好。

冯·诺依曼人物

约翰·冯·诺伊曼(德语:John von Neumann,1903年12月28日-1957年2月8日),原名诺依曼·亚诺什·拉约什(匈牙利语:Neumann János Lajos),出生于匈牙利的美国籍犹太人数学家,现代电子计算机与博弈论的重要创始人,在泛函分析、遍历理论、几何学、拓扑学和数值分析等众多数学领域及计算机学、量子力学和经济学中都有重大贡献。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

机器视觉技术

机器视觉(Machine Vision,MV)是一种为自动化检测、过程控制和机器人导航等应用提供基于图像的自动检测和分析的技术和方法,通常用于工业领域。

推荐文章
暂无评论
暂无评论~