「边缘计算」大热,这家17岁的机顶盒芯片公司发布终端AI芯片

撰文 | 王艺

10 月 31 日,杭州国芯科技(以下简称「国芯」)在深圳举办了一场发布会,发布其新产品 AI 终端芯片 GX8010,这是一款搭载 NPU 的物联网人工智能芯片。有趣的是,在发布该 AI 芯片之前,成立于 2001 年的国芯主打产品是数字电视芯片和机顶盒芯片。

机顶盒和 AI 是两个看似完全不相关的领域。但其实,机顶盒芯片负责处理图像和声音信号,而图像和声音正是当下 AI 的两大基础任务。据国芯 CEO 黄智杰介绍,正是看到了两种技术之间的互通之处,公司才决定向 AI 芯片领域进军。

终端芯片之热

国芯举办发布会的前后几天,是深圳安博会热闹进行的日子。机器之能在安博会现场发现,与智能相关的大大小小展位中,「边缘计算」可谓第一热词。

「边缘」,即靠近物或数据源头的网络边缘侧,也就是终端。在终端融合网络、计算、存储、应用的计算模式被称为「边缘计算」。

由于在本地实时处理数据,「边缘计算」具备很多优势,例如能够省去网络传输延时,减少带宽占用,且安全性和私密性能够得到保证。因此最近在 AI 行业,深度学习的预测阶段从云端向终端移动的趋势非常明显。

比如,在国芯发布会的第二天,同样是在深圳,专注于计算机视觉的阅面科技也发布了其终端计算模块「繁星」,让安防摄像头、机器人等 IoT 设备具备终端视觉计算的能力。

在语音领域,云知声在攻克了识别层面的难题后也转而致力于语音 AI 芯片模组的研发。

同样,在不久之前的 10 月 20 日,嵌入式人工智能解决方案公司地平线科技获得了英特尔领投的近亿美元 A+ 轮投资,将着重打造搭载在汽车上的自动驾驶芯片。

国芯的想法与产业大潮无异。

那么,终端和云端芯片的需求到底有何不同?云端设备以谷歌 TPU 为例,常常是超大规模的服务器群组,甚至是面积达数千平方米的超算中心。虽然对能耗和成本有所要求,但没有终端芯片这样敏感,发热和噪音问题也不是云端设备需要首要考虑的问题。

但当 AI 技术来到售价在几百人民币甚至更低的终端设备时,以上的一切都是问题。瞄准终端的国芯希望能够解决终端设备上的模型压缩问题,同时设计出能够支持 IoT 设备的低功耗、低成本芯片。

由于物联网设备中,内存带宽小,因此国芯专门设计了神经网络压缩引擎 NCompressor,能利用神经网络中的数据稀疏特性,压缩计算权重,可实现6~10倍的压缩效果。此外,在芯片架构、编译工具、SDK、芯片与开源框架的结合等各个层面均有考量。

此外,为了配合编译压缩工具,国芯还发布了全套神经网络开发 SDK,只需要简单三步,就能完成模型从服务器到芯片的部署。首先,在 Tensorflow 等平台训练,生成模型的网表文件。其次,使用 gxNPUC(神经网络编译器)进行编译和压缩,生成指令 bin 文件。最后,在芯片上使用 gxDNN 加速库,将编译的模型在芯片本地运行即可。

而国芯自主研发的 gxNPU(国芯人工智能专用处理器),结合 CPU、DSP 架构,在成本、功耗、性能的权衡中制定了 GX8010 的终端芯片解决方案。

国芯表示,在典型应用的性能评测中,gxNPU@200MHz 比树莓派中的多核 CPU@1GHz 快了近 30 倍,能效提升 100 倍以上。

借力 AI 公司,发力智能音箱、智能玩具等场景

作为一款物联网人工智能芯片,实际上,要想真正落地,光有 NPU 还远远不够。因为,整个 AI 交互过程非常复杂,除了神经网络计算,还包括传感器接入、信号处理、检测识别,以及软件层面的决策和反馈等。环节众多,每一处需要的算法和计算特性都不相同。

比如,在智能语音交互领域,当前语音识别的巨大挑战就在于前端的语音降噪,为了解决噪声和有效语音分离问题,业内的通常做法是引入麦克风阵列,利用空间信息进行降噪滤波。但是,多个麦克风的引入首先对硬件上的接口就提出了要求,一些传统芯片没有这么多接口只能通过其它器件来扩展。同时多路信号的接入,也使得前端语音处理计算量大增,传统芯片中大家用 CPU 软解已是十分吃力。

国芯则在芯片中集成其长期合作伙伴 Cadence Tensilica 的语音 DSP Hifi-4,据国芯介绍,Cadence Tensilica HiFi DSP 系列是全球最广泛使用的音频/声音/语音处理器。而这颗 DSP Hifi-4 则专门为智能语音而设计,可以进行各种语音信号处理计算。此外,GX8010 芯片支持 8 通道麦克风接口,不仅有 PDM 和 I2S 数字接口,还内置了 8 路 ADC 直接支持模拟麦克风。

而在算法方面,国芯则与 Rokid 和思必驰合作,这两家拥有语音技术的公司为国芯提供算法支持,国芯表示,在未来,将有更多的合作伙伴加入。

为什么需要两家或更多的语音公司同时介入?事实上,国芯希望,当一家有人工智能 IoT 设备需求的公司找到国芯时,能够根据所需设备类型找到相应的顶层算法。例如对于想做车载语音后视镜的公司来说,采用国芯的芯片以及思必驰的技术能够轻松完成产品研发;同样的,对于想做智能音箱的公司来说,可以选择国芯的芯片加上 Rokid 的技术。

对于像国芯这样想要进军 AI 领域的公司来说,拥有自己的 AI 技术看似是理所当然地重要。按正常的商业逻辑,国芯或许会组建自己的 AI 技术团队,或者像 Intel 一样通过收购获得技术。

然而 CEO 黄智杰却对其对于 AI 公司的依赖甘之如饴,并表示「为什么要摆脱 AI 合作伙伴?」

在黄智杰眼中,芯片就应该是多方合作的结果。Rokid 创始人 Misa 在现场也表示:「就像我们不会自己做芯片一样,国芯也没有必要从上至下包揽所有技术。」

事实上,目前市场上的 AI 芯片可以按功能分为单一功能的 AI 芯片和全能 AI 芯片,即芯片只是具备语音或图像一种功能还是全能。

国芯的 GX8010 属于后者,它具备语音和视觉两个模块。除了语音系统外,GX8010 还构建了视觉系统,支持 1080P 摄像头输入,图像预处理,MJPEG 编码等模块。语音和图像的信号处理完后,都送到中央的决策和应用系统进行业务和应用处理。

然而,在当前发布的第一个版本中,视觉模块并没有重点打磨。GX8010 的产品经理 Robot Ling 表示,视觉模块需要较大的计算能力,在后续的产品发布中会逐步强化视觉相关计算能力。

市场上单一功能的芯片多为 AI 公司自行研发,而 AI 公司一般说来是深耕在语音或图像的单一领域中,因此造出来的芯片自然功能单一,且更多的是针对自身业务发展。

国芯的产品经理 Robot 表示,其实单一功能的芯片和全能芯片在成本和功耗上相差不多。既然国芯的角色是芯片制造商,那么何乐而不为?况且国芯判断(也是业内普遍看法),在未来,语音和图像技术必将结合在同一款产品中,到那时,就是全能芯片正式发挥作用的时候。

而国芯发布的这款芯片,应用场景则在于智能音箱,使电视、机顶盒、家电等产品实现智能化升级,使其具备语音交互能力。此外,国芯还会凭借这款芯片在智能玩具和幼教市场发力。

入门国芯科技芯片产业边缘计算