从提供IP到量产芯片,这家AI新贵策略转变背后的逻辑

业内知名媒体EE Times每年都会举办“Silicon 60”评选活动,选出全球最值得关注的60家半导体新创公司。统计显示,今年选出来的“Silicon 60”企业以机器学习为主流,共有15家相关企业入选,与去年七月相比大幅提升,这从侧面反映了近年来AI产业的流行。

值得一提的是,总部设在美国加利福尼亚州的企业出现在榜单中的频率越来越高,今年更是有29家之多,当中大多与人工智能芯片有关,其中有一家企业更是首次入选——那就是由加州大学洛杉矶分校电子工程系博士刘峻诚创立的耐能(Kneron)。

耐能科技的创始人兼CEO刘峻诚

资料显示,该公司2015年创立于美国圣地亚哥,是终端人工智能解决方案的领导厂商,提供软硬件整合的解决方案,包括终端设备专用的神经网络处理器(Neural Processing Unit,NPU)以及各种图像识别软件。依赖于其高能耗的产品,耐能已经也与格力和搜狗等多家大厂达成了长期合作。公司更是在推出了两代IP产品之后,谋划于明年推出ASIC芯片,进一步深耕人工智能应用市场。

为了让大家对这家人工智能新贵有更深入的了解,半导体行业观察记者日前采访了耐能的创始人兼CEO刘峻诚,给大家带来他对公司和行业的最新见解。

实力雄厚团队缔造的人工智能IP新贵

过去几年深度学习算法准确率的提升,推动了整个人工智能应用的兴旺,巨大的市场容量吸引了大量的创业者投身其中。尤其是在边缘终端AI芯片方面,更是百花齐放,百家争鸣。但这些企业做边缘端AI芯片,只有两个途径可供选择,那就是自研人工智能IP,或者授权第三方的NPU IP,而耐能在创业初期就是从NPU IP切入,也是当中的一个佼佼者。

今年年初,该公司推出的第一代NPU IP在市场获得了高度认可。但锐意创新的耐能马不停蹄,在短短的半年之后,就带来了其第二代终端人工智能处理器系列NPU IP ——KDP Series。当中包括了超低功耗版KDP 320、标准版KDP 520、高效能版KDP 720等三大产品,全系列产品的功耗低于0.5瓦(W),采用新的架构设计让计算更具弹性,整体效能相较于上一代产品大幅提升达3倍,峰值吞吐量(Peak Throughput)最高更是可以达到5.8TOPS(每秒万亿次计算)。

耐能的第二代NPU核心技术

刘峻诚表示,耐能新一代NPU产品在诸多方面取得显著的突破,基于第一代产品的优势,改善数据计算流程、提升整体计算效能与储存资源使用率,同时针对不同的神经网络模型进行优化,让NPU可以更广泛地应用在各种终端设备,并满足更复杂的计算需求。新的IP的出现,也让耐能在11月初正式推出支付等级3D AI软硬件一体化解决方案,进入新一个高增长的市场。

耐能的NPU产品线

在问到如何在群雄并立的AI芯片市场站稳脚跟,并且在短短半年间就可以做到产品更新的时候,刘峻诚告诉半导体行业观察的记者,这首先依赖于其实力雄厚的技术团队。

“耐能的核心团队成员都有很强的技术背景,来自加州大学洛杉矶分校、圣地亚哥分校以及普渡大学、北京清华大学、台湾大学、新竹清华大学等名校,而且长期任职于高通英特尔、三星、博通、IBM、贝尔实验室等国际大厂,在AI、计算机视觉图像处理领域的工作经验平均超过10年。同时,公司在自主原创的人工智能算法、神经网络软件、硬件核心设计等领域,已在4个国家共申请了近20项专利。”,刘峻诚说。

其次,耐能在圣地亚哥、台北、深圳、珠海都设有办公室,布局两大洲四个城市。这也加速了他们的崛起。刘峻诚指出,美国和中国大陆的AI技术更新迅速、市场庞大,台湾能提供从设计、封装到测试都很齐全的供应链,这就使耐能的产品可以快速落地并交付给客户。

第三,耐能起步早,和不少大厂都有长期合作,从中获取了大量训练数据,加上耐能自主开发的算法,可以针对不同需求调整功能。

在团队和产品的双重影响下,耐能于2017年11月完成A轮融资,包含阿里巴巴创业者基金、中华开发资本国际、奇景光电、高通、中科创达、红杉资本的子基金Cloudatlas以及创业邦。2018年5月31日,耐能又获得了由李嘉诚旗下维港投资领投的A+轮融资,累计融资金额超过3300万美元。

“现在,耐能正在进行新一轮融资,近期便将向外界公布。”,刘峻诚强调。相信其聚焦市场的容量,对耐能吸引投资产生了重要的推动作用。

聚焦三大市场让AI无处不在

刘峻诚告诉半导体行业观察的记者,耐能产品主要应用于智能手机、智能家居与智能安防等三大领域。当中的应用场景包括了智能手机、智能门锁、智能家电、智能监控摄像机、门禁系统、无人机、新零售、智能玩具等。公司的客户、合作伙伴也包括了格力、搜狗、奇景光电等厂商。

能同时覆盖这三个市场巨大的市场,耐能各具特性的的超低功耗、标准和高效能的三大产品线布局是根本:

首先看其低功耗版的KDP 320。从刘峻诚的介绍我们得知的,这个包含计算与静态随机存取内存(SRAM)的处理器功耗不到5mW,能够应用到低功耗智能终端和手机等领域,而手机3D面部识别应用就是其一个重要的应用方向。据了解,依靠于耐能的这个方案,可进行3D结构光与来自双镜头的立体图像识别分析,让真人面部识别更快速精准;

其次,再看标准版的KDP 520,这个处理器的计算能力可达481GOPS (500MHz) (每秒十亿次计算),功耗也是仅有100mW。可进行快速实时、大规模的面部、手势、身体识别与分析以及深度学习,是智能家居和安防市场的不二选择。

第三,高效能版的KDP 700信息吞吐量可高达5.8TOPS(1GHz) (每秒万亿次计算),功耗为300~500mW。这样优异的计算能力,让它能处理更进阶与复杂的人工智能计算,以及深度学习推理应用,能够满足高端智能手机、机器人、无人机和更高端的安防需求。

在这三大系列IP的加持下,耐能于今年11月举办的2018腾讯全球合作伙伴大会上带来了支付等级的3D AI软硬件一体化解决方案。

众所周知,近年来,由于智能手机和安防等应用的推动,人脸识别的应用越来越广泛。国际权威市场洞察报告gen market insights在其名为《全球人脸识别设备市场研究报告》的报告中指出,全球的人脸识别市场将从2017的10.7亿美元上升到2025年的71.1亿美元,并在此期间以每年26.8%的增量不断提升。耐能的方案就是为了解决这个问题而来的。

据介绍,这套方案能够采用商业化等级的CNN(Convolutional Neural Network , 卷积神经网络)模型,适配于主流的CNN网络,以及2D、3D视觉应用与音频应用。同时,拥有领先的模型压缩技术,支持无损、有损压缩,并与硬件设计协同工作,可减少模型尺寸和计算成本。能够满足结构光、ToF和双目视觉等多种硬件方案下的多种识别需求。

“依托超低功耗、拥有全球领先算力的耐能KDP系列AI芯片IP加持,耐能3D AI软硬件一体化解决方案在智能手机、智能安防、智能家居、新零售、工业智联网等领域均有不俗表现。我们现在也已经与多家国际大厂展开合作,预计将在2019年 Q2 大规模量产。”刘俊诚强调,并进一步指出,“耐能将持续专注终端AI领域,提供客制化的、软硬件整合的解决方案,以AI赋能终端设备,让AI无处不在。在产品形态上,近期将对NPU产品进行持续升级,推出更高算力、更低功耗、更小体积的产品,以降低AI应用门槛与客户开发成本。长期来看,则将从视觉识别延伸至语音识别、人脑模拟等领域,在更长的产品线上为客户创造价值。”

在10月的北京安博会上,奇景光电推出了基于结构光技术的3D传感解决方案,该方案采用的便是耐能的人脸识别算法。而在12月中旬,据台湾媒体报道,钰创科技、钰立微电子宣布推出基于耐能NPU IP的ToF方案。至于双目视觉方案,据悉在2018腾讯全球合作伙伴大会上也已展出,不过相关厂商的名称尚未公开,对此,刘峻诚的回复是“基于保密义务,暂不便说明。”

携手业内领先IP供应商探索未来的无限可能

除了持续推出领先的人工智能IP外,耐能还联手业内领先处理器IP和机器视觉IP供应商,探索更多的可能。

今年12月初,耐能宣布,将结合耐能针对终端设备所设计的神经网络处理器(Neural Processing Unit , NPU)与新思科技(Synopsys )ARC®处理器,推出低功耗AI IP解决方案。双方将共同展开进一步的合作推广计划,携手拓展市场,以加速终端人工智能的开发与应用。

行内的人都知道,除了其领先的EDA工具好之外,新思科技在IP方面的表现也非常出色。而ARC®处理器IP则是其中的一个代表。从他们的官网我们可以看到,新思科技的 DesignWare® ARC® 处理器是 32 位 CPU,经 SoC 设计人员的优化,可满足各种不同用途的需求,从各类细分市场深度嵌入式应用到高性能主机应用,不一而足。设计人员可利用可综合来定制各个 ARC 核实例,使产品各不相同,以满足特定性能、功耗和面积的要求。ARC®处理器还具有可延展性,可让设计人员添加自己的定制指令,从而大大提高性能。 全球已有超过 225 家客户使用新思科技ARC®处理器,这些客户每年总共产出 19 多亿块基于 ARC®处理器IP的芯片。双方的强强联合必能给终端应用带来无限可能。

刘峻诚也表示:“结合耐能NPU 低功耗、体积小的特性与新思科技ARC®处理器的优异性能,协助客户采用终端人工智能解决方案的进度。低功耗AI IP解决方案可应用于智能家居、3D人脸解锁以及对能耗和空间有高度要求的物联网设备,且能满足复杂的计算需求。”

与另一家IP供应商Cadence(楷登电子)的合作,进一步拓展了耐能产品的应用范围。在谈双方搞的合作之前,我们要先介绍一下Cadence的可定制处理器(Xtensa)。

业内知名专家唐杉曾在其一篇文章中提到,Cadence Tensilica的可定制处理器(Xtensa)主要有两方面的定制性:第一、可配置性(Configurability):从指令集,微结构,接口等方面都提供一些可配置的选项。你可以通过菜单选择的方式定制适合你自己应用的处理器;第二、可扩展性(Extensibility):使用Tensilica Instruction Extension (TIE)的方法,增加你自己的指令,寄存器,寄存器堆等等。你可以使用和verilog类似的TIE语言来描述自己的datapath单元的功能,而相应的RTL代码和工具链则自动生成。Cadence的Tensilica Vision P6 DSP则是双方这次合作的一个重点。

据介绍,这个DSP是以Cadence Tensilica Xtensa架构为基础,结合灵活硬件选项与丰富图像、视觉DSP功能,以及众多来自既有生态系统合作伙伴的图像、视觉应用程序,该软件环境提供包括对1700多个基于OpenCV的视觉和OpenVX™1.1库函数的完整与优化的支持,并全面支持Tensilica广大的其他应用软件、模拟、晶圆与服务等合作伙伴生态系统。

在刘峻诚看来,这个DSP结合耐能低能耗、高计算力的人工智能处理器NPU IP KDP 720,可以满足他们创新图像应用的需求。通过采用此整合性方案,芯片厂商能够轻松地与主机处理器整合,加速SoC的开发进度,为新兴的智能设备开发更丰富的视觉功能。

而在此前,耐能还与智原科技(Faraday)、晶心科技(Andes)、创意电子(GUC)等头部IP厂商达成合作,从而构建起汇聚国际一众头部IP厂商的供应链。在业内诸多NPU厂商中,这样的供应商阵容已足够亮眼。

对于系统厂做终端AI芯片的看法

由于芯片的开发越来越简单,终端客户的客制化需求也越来越高,这就驱使很多终端系统厂走上自研AI芯片之路,甚至有些厂商连人工智能NPU IP也都自主研发,这就从某种程度上压逼了IP供应商和芯片供应商的生存空间。华为在今年10月举办华为2018全联接大会上推出了其两款采用自主研发加速器IP的AI芯片Ascend 910和Ascend 310,就引发了媒体对其相关供应商的生存大讨论。

在问到这个问题的时候,刘峻诚告诉半导体行业观察的记者:“各界厂商争相涌入,表明AI的发展成果和前景正得到日益广泛的认可。耐能乐见AI芯片市场持续壮大,并期待和友商一起推动产业进步。同时,不同厂商的产品方向与应用领域各异,彼此形成既竞争又合作的关系。在AI产业从野蛮生长向精细发展过渡的阶段,这种竞合关系将加速产业洗牌,投机者将被淘汰,深耕细分市场的企业则有望异军突起。”

“耐能专注终端AI领域,面向智能手机、智能家居与职能安防等市场提供软硬件整合的方案,包括终端设备专用的NPU、IP、算法等,并与多家国际大厂展开业务层面的合作。相信只要找准并坚守自身的方向,不仅可在未来的AI芯片市场占据一席之地,与这些科技巨头或互联网公司也有合作空间。”,刘峻诚进一步指出。

为了满足客户的多样化需求,除了持续推出高能效的NPU IP和软件算法外,耐能将触角伸到了芯片侧。整体的宗旨就是奉行“客制化”策略,根据客户需求提供定制化的产品与解决方案。其间,除了客户的公司实力与供应链整合能力,其主导产品与行业特点无疑也是驱动耐能提供何种产品或解决方案的重要因素。

“具体来看,针对智能手机、智能安防领域,由于下游市场已高度成熟、品牌集中度较高,芯片厂商到终端厂商均具有很强的供应链整合能力,客户的需求主要是IP,因此耐能也定位为IP提供方。而在智能家居市场,竞争格局比较开放,客户对IP和芯片的需求都大量存在,单一的IP或芯片并不能满足,耐能便决定IP和芯片并举”,刘峻诚说。

微软全球执行副总裁、全球电脑视觉和图形学研究领域的专家沈向洋在早前接受《彭博商业周刊》采访的时候说到,人工智能的寒冬一定会再来。在这种环境下,如何能适应市场需求推出更多的产品,如何更方便地解决用户真正的需求,是现在遍地开花的AI芯片创业公司需要考虑的问题。

而耐能已经看到了这点,并跨出了重要一步。

半导体行业观察
半导体行业观察

最有深度的半导体新媒体,实时、专业、原创、深度,30万半导体精英关注!专注观察全球半导体最新资讯、技术前沿、发展趋势。

产业NPUAI芯片神经网络耐能科技
相关数据
搜狗机构

搜狗成立于2003年,是中国搜索行业挑战者,AI领域的创新者。目前搜狗月活跃用户数仅次于BAT,是中国用户规模第四大互联网公司。2004年8月,搜狗推出搜狗搜索,现已成为中国第二大搜索引擎。2006年6月,推出搜狗输入法,重新定义了中文输入,目前搜狗输入法覆盖超5亿用户,是国内第一大中文输入法。2017年11月9日,搜狗在美国纽约证券交易所正式挂牌上市,股票交易代码为“SOGO”,开盘价为13.00美元,市值超50亿美元。

http://corp.sogou.com/
英特尔机构

英特尔是计算创新领域的全球领先厂商,致力于拓展科技疆界,让最精彩体验成为可能。英特尔创始于1968年,已拥有近半个世纪产品创新和引领市场的经验。英特尔1971年推出了世界上第一个微处理器,后来又促进了计算机和互联网的革命,改变了整个世界的进程。如今,英特尔正转型成为一家数据公司,制定了清晰的数据战略,凭借云和数据中心、物联网、存储、FPGA以及5G构成的增长良性循环,提供独到价值,驱动日益发展的智能互联世界。英特尔专注于技术创新,同时也积极支持中国的自主创新,与产业伙伴携手推动智能互联的发展。基于明确的数据战略和智能互联全栈实力,英特尔瞄准人工智能、无人驾驶、5G、精准医疗、体育等关键领域,与中国深度合作。面向未来,英特尔致力于做中国高价值合作伙伴,在新科技、新经济、新消费三个方面,着力驱动产业协同创新,为实体经济增值,促进消费升级。

https://www.intel.com/content/www/us/en/company-overview/company-overview.html
相关技术
高通机构

高通公司(英语:Qualcomm,NASDAQ:QCOM)是一个位于美国加州圣地亚哥的无线电通信技术研发公司,由加州大学圣地亚哥分校教授厄文·马克·雅克布和安德鲁·维特比创建,于1985年成立。两人此前曾共同创建Linkabit。 高通公司是全球3G、4G与5G技术研发的领先企业,目前已经向全球多家制造商提供技术使用授权,涉及了世界上所有电信设备和消费电子设备的品牌。根据iSuppli的统计数据,高通在2007年度一季度首次一举成为全球最大的无线半导体供应商,并在此后继续保持这一领导地位。其骁龙移动智能处理器是业界领先的全合一、全系列移动处理器,具有高性能、低功耗、逼真的多媒体和全面的连接性。目前公司的产品和业务正在变革医疗、汽车、物联网、智能家居、智慧城市等多个领域。

华为机构

华为成立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。华为的主要业务分布在无线、网络、软件、服务器、云计算、人工智能与大数据、安全、智能终端等领域,发布了5G端到端解决方案、智简网络、软件平台、面向行业的云解决方案、EI企业智能平台、新一代FusionServer V5服务器、HUAWEI Mate等系列智能手机、麒麟系列AI芯片等产品。目前华为拥有18万员工,36所联合创新中心,14所研究院/所/室,业务遍及170多个国家和地区。

http://www.huawei.com/cn
微软机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
沈向洋人物

微软全球执行副总裁,美国工程院院士。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

OpenCV技术

OpenCV的全称是Open Source Computer Vision Library,是一个跨平台的计算机视觉库。OpenCV是由英特尔公司发起并参与开发,以BSD许可证授权发行,可以在商业和研究领域中免费使用。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

推荐文章
暂无评论
暂无评论~