杜芹作者

泡沫过后,沉淀下来的AI芯片将落在何处?

前几年的“人工智能热”让大小厂商陆续跳入AI芯片的研发大军中,而当这股潮水褪去,当初的50多家公司大多数都黯然退出历史舞台,如今只剩10家左右。AI芯片的风口已然过去。据艾瑞咨询发布的2019年《AI芯片行业研究报告》指出,目前AI芯片行业接近Gartner技术曲线泡沫顶端,只有通过市场检验和筛选的优质团队才能够继续获得产业、政策和资本的青睐与支持。

随着AI芯片进入深水区,人们更关注的不再是单纯的算力,还有对应用落地和商业化的支持:进入了哪些场景?合作了哪些客户?有没有软硬一体化方案?是否已经有实际案例?……“AI落地难”已成行业共识,浮华过后,AI芯片接下来将进入市场检验真理的阶段。

AI芯片为何落地难?

首先,我们来看下当前AI芯片的格局。目前市面上AI芯片主要分为云端AI芯片与终端AI 芯片,云端AI芯片主要部署在大型服务器中,可支持图像、语音等不同类别的AI 应用;终端芯片则被放在音箱、摄像头等硬件设备中。由于云端芯片起步较早,且所需要协同的CPU/GPU等硬件成本投入规模高,该领域已被英伟达、Intel等巨头瓜分殆尽;国内一众AI从业者大多选择发力在终端芯片领域,如自动驾驶、安防、零售、智能硬件等。但AI芯片终端市场细分化、碎片化、应用场景不明确也是一大难题。

至于AI芯片落地难的原因可能有无数个。例如,芯片研发比AI语言的更迭速度慢,当芯片面市时,其采用的AI语言可能已经过时了。这种问题首先体现在量产,但归根结底,缺乏杀手级应用场景才是最致命的。AI芯片厂商高投入研发过后,却不知道自己的产品要卖给哪些客户或者说应用到哪些产品上,无法找到可持续性的落地场景。

地平线的联合创始人兼副总裁黄畅表示,缺乏杀手级应用使得现有的AI芯片大多没有清晰的定位,无法高度优化PPA。做半导体的都知道PPA有多么重要,尤其是Performance。AI芯片需要针对应用场景进行设计,以此来指导研发调整优化方向,引导客户进行正确选择,同时能够促进行业有序协同向前发展。

再者,用户接受度也不高,AI应用所需要的数据闭环难以形成。需要明确的是,AI应用开发模式与传统软件开发流程不同,传统软件开发可清晰定义功能,通过编程就能实现;而AI应用则要通过示例(数据)来定义功能再进行开发,需要形成数据闭环,且自动迭代。

“AI是一个全新领域,AI芯片需要支撑的不仅是AI计算,更要面向场景,实现完整的功能。芯片公司多年的积累不是主要矛盾,其主要矛盾是如何将软硬件结合起来,开发出一个高效能、低功耗、低成本,同时能够又快又准的完成自主机器人的任务。AI芯片的成功不止于将ISP调的好,能够看清楚;也不是将传统的语音算法做的更精进,更不是说一个传统的车规芯片公司把CPU和DSP升级成一个NPU,AI芯片没有那么简单。”黄畅如是说。

在纷繁复杂的碎片化终端市场中,最需要什么样的AI芯片?黄畅认为:“需要的是能极致优化PPA的AI芯片,这个PPA的提升需是数量级的,要能适应未来数年的算法演进,同时充分考虑算法发展,从而能真正替代GPU。”

但黄畅也告诉半导体行业观察记者,目前AI芯片也有其可取之处,例如,大多数AI芯片的工具链都能对场景深度学习框架有比较好的支持,也培养了一些开发者,在开发成本上有一定的降低,减少了对于Cuda之类的编程生态的依赖。

谁来定义AI芯片的“好坏”?

都说AI芯片难落地,客户难评判,那么一款AI芯片的“好坏”究竟如何来评估呢?是TFLOPS?是TOPS?还是MLPerf?AI芯片界好像依然没能找到完美体现真实性能的衡量标准。

为何这么说?目前业界惯常使用的芯片评测标准有两种,一是峰值算力,但这只反映AI芯片理论上的最大计算能力,而非在实际AI应用场景中的处理能力,具有很大的局限性;二是目前行业较为知名的基准测试组织MLPerf,但其采用的模型少且更新速度滞后于算法演进的速度,无法及时反映算法效率的提升以及各种精度下芯片能够达到的计算速度,因而无法描述芯片AI性能的全貌。

针对当前AI芯片评测中存在的问题,地平线提出MAPS(Mean Accuracy-guaranteed Processing Speed)评测方法,针对应用场景的特点,在精度有保障的前提下,包容所有与算法相关的选择,评估芯片对数据的平均处理速度。为行业提供一个评估芯片AI性能的全新视角。

“评估芯片AI性能,本质上应该关注做AI任务的速度和精度,即‘多快’和‘多准’。”

黄畅介绍说:“MAPS评测方法,能关注真实的用户价值,将每颗芯片在‘快’和‘准’这两个关键维度上的取舍变化直观地展现出来,并在合理的精度范围内,评估芯片的平均处理速度。这个方法具有可视化和可量化的特点。”

MAPS 聚焦“快”和“准”两个关键评测维度,用最优帧率精度所围面积直接体现 AI 芯片的最强能力按照黄畅的说法,这个全新的MAPS评估方式对行业来说有六大创新之处:

  • 第一,它将芯片的Benchmark通过图形变得可视化,表达更精准;
  • 第二,该方式关注真实、面向结果的需求,只在乎精度和速度,不在乎中间任何关于算法的取舍和选择;
  • 第三,可以统一表示精度与速度,关注主流精度区间;
  • 第四,隐藏与最终结果无关的中间变量,包括模型、输入大小、批处理的量是多大;
  • 第五,通过MAPS评估方法可以在算力之外帮助用户理解这个芯片到底能跑多快以及多好;
  • 第六,留有最大的空间引导客户使用最优的方式使用某一颗芯片,这一点非常重要,是去真正指导客户使用这个芯片的最佳实践。

芯片是个生态系统,单独依靠一家之力是玩不转的。地平线的MAPS评估标准最重要的意义是让行业能够形成一种合力,让大家更好的协同,不管你是买方还是卖方,大家都有一个相对清晰的目标,容易形成共识、形成协力,这样才好健康地去推动整个行业往前发展。黄畅表示。

AI芯片花开两朵:“旭日”东升,“征程”万里

有了好的评估标准之后,AI产业向好,经历过大风大浪的AI芯片,最终将落在哪些场景中呢?作为一家以“为客户提供的智能化价值”的人工智能公司,地平线将其AI芯片的种子洒向了AIoT和自动驾驶航道,花开两朵,同心向阳。

“做AI芯片需要企业有很强的洞察力,要在三五年前找到落脚点,以创造真实的价值为导向,本着长期主义的精神坚持不懈的走下去。”黄畅谈到。

自动驾驶被看作是AI芯片的杀手级应用的潜力市场,近年来伴随智能驾驶渗透率的提升,全球芯片巨头也在纷纷向汽车这个产业靠拢。汽车AI芯片市场未来仍是各大巨头竞争角逐之地。目前在AI自动驾驶方面,国外的英伟达、英特尔、特斯拉,国内的华为地平线寒武纪以及芯驰科技等一众厂商都在深耕这个领域。

地平线是中国最早进入AI芯片领域的人工智能企业。2015年,在国内AI芯片仍未进入大众视野时,地平线公司成立,率先提出软硬结合的BPU芯片架构;2017年,发布中国第一款边缘AI芯片:旭日一代和征程一代;2018年,征程芯片助力国际顶尖Robotaxi车队;2019年,宣布正式量产中国首款车规级AI芯片征程2。

这几年,地平线在商业化的道路上越走越稳。就拿征程2 来说,该产品可全方位实现车内场景化感知,并基于感知结果为用户提供更精准的智能推荐以及智能车控等服务。

今年3月份,地平线征程2登陆长安UNI-T前装量产,使长安UNI-T成为首款搭载国产人工智能芯片的智能汽车,而且也让它走在了世界前列,成为全球首款智能人机交互SUV。

众所周知,车载AI芯片是人工智能行业的珠穆朗玛,也是自动驾驶实现大规模落地的前提。车规级芯片产品的开发周期长、难度大,是硬科技、长跑道的创新。在汽车芯片如此高标准以及长供货周期、与主机厂长久的合作关系下,汽车芯片一旦能够量产,其供应格局相对来说就较为稳定。

虽然,相比市场前景更大、场景更为复杂的自动驾驶,地平线在AIoT领域的声量较小,但其重视程度丝毫不差。据了解,其旭日系列芯片所服务的客户已过百家。去年发布的旭日2的表现也相当亮眼,在旭日2上的实际测试结果表明,分类模型 MobileNet V2 的运行速度超每秒 700 张图片,实际性能能够达到甚至超过业内标称 4TOPS 算力的 AI 芯片。

在AIoT领域,地平线坚持底层技术能力研发与解决方案的打造,加速普惠 AI 时代到来;在开发者生态方面,地平线则通过工具链服务降低开发者门槛,助力上层应用产生,以此丰富整个 AIoT 应用生态,用行业的力量推动行业。目前,地平线已携手上百家 AIoT合作伙伴为产业提供赋能服务,实现线下场景服务数千万人口。

结语

自去年旭日2的发布,又经过近一年的商业化落地和技术锤炼,面向AIoT市场的旭日3正呼之欲出。在此,想剧透下,此前,地平线有在ImagetNet模型上进行了一项MAPS测试,下图中有一颗地平线即将推出的芯片,在与表现最优的标称11.4TOPS峰值算力的AI芯片对比中,新的芯片虽然在高精度上稍有劣势,但在追求速度和低延迟等场景中会有不俗的表现。9月9日上午,“地平线”尽头将再次升起一轮“旭日”!

ImageNet图像分类 75~80.5%精度范围内, MAPS 评估方式下的主流芯片测试结果(右一折线为地平线最新一代芯片测试结果)

半导体行业观察
半导体行业观察

最有深度的半导体新媒体,实时、专业、原创、深度,30万半导体精英关注!专注观察全球半导体最新资讯、技术前沿、发展趋势。

产业AI芯片
相关数据
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

https://www.intel.cn/content/www/cn/zh/homepage.html
相关技术
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商,致力于把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。目前华为有19.4万员工,业务遍及170多个国家和地区,服务30多亿人口。

https://www.huawei.com/cn/
寒武纪机构

寒武纪科技是全球智能芯片领域的先行者,宗旨是打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片。公司创始人、首席执行官陈天石教授,在处理器架构和人工智能领域深耕十余年,是国内外学术界享有盛誉的杰出青年科学家,曾获国家自然科学基金委员会“优青”、CCF-Intel青年学者奖、中国计算机学会优秀博士论文奖等荣誉。 团队骨干成员均毕业于国内顶尖高校,具有丰富的芯片设计开发经验和人工智能研究经验,从事相关领域研发的平均时间达七年以上。 寒武纪科技是全球第一个成功流片并拥有成熟产品的智能芯片公司,拥有终端和服务器两条产品线。2016年推出的寒武纪1A处理器(Cambricon-1A)是世界首款商用深度学习专用处理器,面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备,在运行主流智能算法时性能功耗比全面超越CPU和GPU,与特斯拉增强型自动辅助驾驶、IBM Watson等国内外新兴信息技术的杰出代表同时入选第三届世界互联网大会评选的十五项“世界互联网领先科技成果”。目前公司与智能产业的各大上下游企业建立了良好的合作关系。在人工智能大爆发的前夜,寒武纪科技的光荣使命是引领人类社会从信息时代迈向智能时代,做支撑智能时代的伟大芯片公司。

http://www.cambricon.com
地平线机构

地平线作为嵌入式人工智能全球领导者,致力于提供高性能、低功耗、低成本、完整开放的嵌入式人工智能解决方案。面向智能驾驶、智能城市和智能商业等应用场景,为多种终端设备装上人工智能“大脑”,让它们具有从感知、交互、理解到决策的智能,让人们的生活更安全、更便捷、更美好。

http://www.horizon.ai
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

图像分类技术

图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

端AI芯片技术

AI芯片部署的位置有两种:云端、终端。所以根据部署的位置不同,AI芯片可以分为:云AI芯片、端AI芯片。终端,即手机、安防摄像头、汽车、智能家居设备、各种IoT设备等执行边缘计算的智能设备。终端的数量庞大,而且需求差异较大。

量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

推荐文章
暂无评论
暂无评论~