「人工智能有多少智能,就有多少人工」对于这句话感触颇深的是中科创达副总裁,机器视觉业务线的负责人孙力。在深耕智能操作系统十余年的中科创达,孙力认为人工智能的价值远不在算法的价值,而是在于其延伸价值——即植入芯片、中间件、算法和操作系统,载入硬件平台、结合云计算和管理系统——成为完整可用的方案的价值。
2008 年,中科创达从手机操作系统起家,2015 年成功上市。在资本和技术的双重推动下,中科创达的业务全面铺开。目前,其三条业务主线包括 IoT、汽车电子、手机,其中以手机平台为主的嵌入式操作系统作为主营业务,占六成左右,物联网和汽车电子分别占剩下比重的一半。
近日,在清华大学举办的嵌入式 AI 大会上,中科创达联合清华大学、美国高通公司等高层领导和学术代表分别就嵌入式人工智能技术的发展方向和落地应用现状进行了探讨。活动期间,机器之心与孙力针对过去一年机器视觉的热门技术应用问题进行了探讨。
机器视觉终端的三大应用场景
孙力认为,手机的 AI 应用很大程度发生在 APP 里。在终端本身,主要是将 AI 用于相机的场景识别。比如美颜,场景识别等。「当我们拍了一处夕阳特别就能特别像大片,很可能是因为手机做了特殊处理。」在以前,手机的 AI 化尚未普及时,面对所有的场景都是调同一套参数,但现在,在终端就能够根据不同场景调用不同算法。「而且这必须在终端实现,哪怕在 5G 时代,用于也接受不了云端的返回时间。」孙力认为。
在家电场景,比如冰箱和微波炉的内置摄像头,可以用于识别食物。比如冰箱里的鸡蛋是否变质,微波炉应该选用什么档位。在汽车场景里,机器视觉的应用可分为两类内:车内和车外。对内,监控驾驶员疲劳程度,以及不同乘客进入到车内后的个性化选择,比如座椅幅度、音乐风格等;对外,识别车外的各种复杂场景,比如红绿灯、行人、斑马线等。
针对不同使用场景,机器视觉的应用制约条件也不尽相同。在安卓手机层面,最大的制约来自于生态系统比较紊乱,高通、联发科、展讯等厂商的不同芯片即对应着不同的软件站、DSP、GPU。而算法需要与手机的硬件、操作系统、芯片进行深度合作,所以很难出现一个算法像 APP 一样跟所有手机兼容。「优化,是手机端 AI 应用的最大挑战。」孙力谈道。
在汽车场景中,一套基于视觉的自动驾驶系统包含了摄像头、芯片、AI 算法等,以及车规级的严苛要求。孙力表示,目前能够提供整体解决方案的还比较少,中科创达视觉团队是少有的公司——从摄像头的画质调优到核心算法以及底层软件,AI 算法都有涉及,并且对于四大汽车芯片厂商都很熟悉,所以中科创达在该领域的进展很快。2016 年底,中科创达以 6400 万欧元收购位于芬兰的车载交互技术公司 Rightware,这是其第一次国际并购。
活动现场,中科创达展示了基于骁龙 845 芯片的终端智能分析盒子 AI Kit。孙力介绍,中科创达不是简单地将芯片放进盒子里,而是同时转入的各类应用算法作为参考,比如物体识别、人脸识别等,让开发者能够即插即用。此外,基于此前的嵌入式操作系统经验,中科创达还将发挥摄像头的调优、系统优化等等能力。
孙力认为,高通在整个生态系统里边关键有三个要素,芯片、中间件、算法,将这三个打包就成为应用。在 845 的中间件或 AI Engine,是能够解决异构计算需求的成熟产品,不再依赖于专用的 AI 加速芯片。
相比其他公司,高通具备的是较强的综合能力。算法厂商缺少芯片和中间件,部分芯片厂商中间件所支持的算子和模型有限。孙力表示,AI Kit 还将推出骁龙 855 版本,载有专门的 NPU。
手机之外,3D 视觉的更大舞台
去年,iPhone X 带动了一波刷脸解锁的风潮,但却延续往年的引领者角色。在 Oppo、小米、华为悉数推出单款 3D 人脸解锁手机后,下半年,主流手机厂商基本放弃了 3D 深度视觉的方案,转向屏下指纹。
孙力认为,3D 视觉未能在国内的安卓手机市场推广开来的原因主要有二:
(1)物料成本高,方案刚上市时达到 20-30 美金,在手机市场价格战拼杀到现阶段来看,远不是大部分手机厂商所能接受度的价格。就算到目前为止,3D 模组的价格也没有降低到规模化的程度。
(2)多种的光学设计方案(ToF,结构光,双目,主动双目等)、安卓手机厂商和芯片厂商共同导致供应链和系统的碎片化,导致这样一套新方案很难在体验层面达到标准化。
但孙力仍然对 3D 视觉的应用方向保持乐观,他认为当具备以下三项要素后才是深度视觉技术普及之时:1)硬件方面,需要有丰富的 3D 摄像头采集图像,要足够便宜;2)拼接和建模算法,高精度算法;3)在此基础上,才是做 3D 的人工智能应用,比如物体测量、工业质检。
孙力表示,他更看好 3D 的人工智能应用。在工业场景下,需求已经非常明确。比如通过测量猪的体积来推断体重。孙力表示,「虽然听起来稀奇,但确实是真实需求,并且已经在大量使用」,通过 3D 视觉测量出猪的体积,因为圈养供应的饲料一致,根据肥瘦比基本能推算出体重,由此观察出猪的生长曲线。
另外,在需要测量大型物件的场景里,针对瑕疵的凹陷需要精确到毫米级别时,用 3D 视觉建模就能自动计算出结果。相比人力更安全和省力。孙力表示,在上述工业垂直场景中对于 3D 视觉的需求相比手机解锁更为直接和强烈,更适合落地。他表示,在工厂生产线都是 7*24 小时运转,机器和人工智能的介入能够带来显著的运转情况改善。
当 3D 视觉运用到具体工业领域,对于业务方而言还需要具备哪些必要条件,以及制约其发展的主要因素在于?
孙力认为在工业质检领域,对于企业而言,首先需要采集数据,这其中涉及到变量有采集到的数据的特点、采集的数量、采集的设备以及方式。
此外,还需要明确企业里的内部客户是谁?质量部门和研发部门的要求是不一样的。企业内部要一个能说话算数的部门进行管理和对接,将问题抽象出来,阐述清楚,制定有效的判定规则。如果问题无法定义清楚,那么算法工程师没法推进。比如面板检查,是检查存在坏点还是检查颜色不均,存在哪几类问题需要归纳出来。
最后,便是工作流程的梳理和再造。因为 AI 的本质希望减少人力,提升工作效率。那么,在 AI 应用所涉及到财务部门、IT 部门、质量部门、研发部门、工程管理部门、供应链部门等,都需要围绕这项新的生产力要素进行一定的流程改造。
实际部署过程中,流程改造通常是从一个小的突破口开始,当企业尝到甜头了,就会慢慢进一步推动下去,开始相信 AI 能够为他带来更大的回报。想要一开始就大刀阔斧基本很难,因为企业内部每个部门都有其自身的运转模式和体系。当他们对于 AI 没有足够信任的时候,可能前期还要花费双倍的经历,用人力和 AI 对比来验证是否可行。
等到验证可行,方案上线,有会出现新的问题。当企业的制造需求、供应链结构、工艺制程发生改变,原来的算法可能未必能泛化和适应新的条件,所以方案又需要新的部署和升级。不过,这种改变涉及到的人力影响就比较小了。因为现在只需要一两名员工就能服务机器,因为机器已经能够产生巨大的效率。而以前都是机器服务于我们。人服务于机器,人的作用是抽象现实中遇到的问题,让算法功能够实现,让机器代替人工。
AI 芯片创业明年会更好吗?
谈到自动驾驶,孙力认为,纯视觉算法的方案将来一定会落地,但是相比激光雷达的融合方案可能会相对晚一些。
目前,英伟达优势在 AI 算力的强劲,其他厂商 TI、恩智浦、高通等,国内全志等厂商都在积极解决精准化问题。要实现基于视觉方案的自动驾驶,首先,摄像头和机器视觉算法的组合能够实现有效图像的采集;第二,是各个传感器图像的拼接,最棘手的问题在于环视摄像头图像的拼接,以及车内的驾驶员的行为分析。
面向汽车的嵌入式非常严苛,要经过第三方认证,每段代码都要检查,审核周期很长,十分考验公司的现金流。整合更偏向于 Tier1 厂商的领域,博世,作为硬件集成商,逐步降低这个成本,Mobileye、英飞凌、恩智浦,非常强的整合能力,现金流充沛。
在谈到 AI 芯片公司在明年将遇到更残酷的竞争时,孙力分析道,第一代做 AI 加速都是多采用手机芯片,采用类似 DSP 或者 GPU 进行异构运算,功耗比较大,但好处是容易快速出产品,供应链容易管理;作为只能出售 IP 的协处理厂商,可能会面向 soc 大厂商的竞争,比如高通等,以及 ARM 也做加速的 IP,从这个层面来看,想将 IP 卖给第一梯队的芯片公司这条路并不好走。
但是第二梯队的芯片公司存在需求,而 IoT 市场也是更大的空间,将手机架构的芯片用于物联网市场显然是冗余的,比如智能门禁的处理芯片显然是不需要 GPS 功能的。面对更细分市场的需求,大厂显然没法重新开设产品线满足,这些正是创业公司的机会。选择跟偏中低端品牌的芯片厂商合作,推出价格更亲民、功耗更低的物联网芯片——既保证智能化,同时控制成本。