中科创达孙力:当算法免费,AI的延伸价值如何打造?

人工智能有多少智能,就有多少人工」对于这句话感触颇深的是中科创达副总裁,机器视觉业务线的负责人孙力。在深耕智能操作系统十余年的中科创达,孙力认为人工智能的价值远不在算法的价值,而是在于其延伸价值——即植入芯片、中间件、算法和操作系统,载入硬件平台、结合云计算和管理系统——成为完整可用的方案的价值。

2008 年,中科创达从手机操作系统起家,2015 年成功上市。在资本和技术的双重推动下,中科创达的业务全面铺开。目前,其三条业务主线包括 IoT、汽车电子、手机,其中以手机平台为主的嵌入式操作系统作为主营业务,占六成左右,物联网和汽车电子分别占剩下比重的一半。

近日,在清华大学举办的嵌入式 AI 大会上,中科创达联合清华大学、美国高通公司等高层领导和学术代表分别就嵌入式人工智能技术的发展方向和落地应用现状进行了探讨。活动期间,机器之心与孙力针对过去一年机器视觉的热门技术应用问题进行了探讨。

机器视觉终端的三大应用场景

孙力认为,手机的 AI 应用很大程度发生在 APP 里。在终端本身,主要是将 AI 用于相机的场景识别。比如美颜,场景识别等。「当我们拍了一处夕阳特别就能特别像大片,很可能是因为手机做了特殊处理。」在以前,手机的 AI 化尚未普及时,面对所有的场景都是调同一套参数,但现在,在终端就能够根据不同场景调用不同算法。「而且这必须在终端实现,哪怕在 5G 时代,用于也接受不了云端的返回时间。」孙力认为。

在家电场景,比如冰箱和微波炉的内置摄像头,可以用于识别食物。比如冰箱里的鸡蛋是否变质,微波炉应该选用什么档位。在汽车场景里,机器视觉的应用可分为两类内:车内和车外。对内,监控驾驶员疲劳程度,以及不同乘客进入到车内后的个性化选择,比如座椅幅度、音乐风格等;对外,识别车外的各种复杂场景,比如红绿灯、行人、斑马线等。

针对不同使用场景,机器视觉的应用制约条件也不尽相同。在安卓手机层面,最大的制约来自于生态系统比较紊乱,高通、联发科、展讯等厂商的不同芯片即对应着不同的软件站、DSP、GPU。而算法需要与手机的硬件、操作系统、芯片进行深度合作,所以很难出现一个算法像 APP 一样跟所有手机兼容。「优化,是手机端 AI 应用的最大挑战。」孙力谈道。

在汽车场景中,一套基于视觉的自动驾驶系统包含了摄像头、芯片、AI 算法等,以及车规级的严苛要求。孙力表示,目前能够提供整体解决方案的还比较少,中科创达视觉团队是少有的公司——从摄像头的画质调优到核心算法以及底层软件,AI 算法都有涉及,并且对于四大汽车芯片厂商都很熟悉,所以中科创达在该领域的进展很快。2016 年底,中科创达以 6400 万欧元收购位于芬兰的车载交互技术公司 Rightware,这是其第一次国际并购。

活动现场,中科创达展示了基于骁龙 845 芯片的终端智能分析盒子 AI Kit。孙力介绍,中科创达不是简单地将芯片放进盒子里,而是同时转入的各类应用算法作为参考,比如物体识别人脸识别等,让开发者能够即插即用。此外,基于此前的嵌入式操作系统经验,中科创达还将发挥摄像头的调优、系统优化等等能力。

孙力认为,高通在整个生态系统里边关键有三个要素,芯片、中间件、算法,将这三个打包就成为应用。在 845 的中间件或 AI Engine,是能够解决异构计算需求的成熟产品,不再依赖于专用的 AI 加速芯片。

相比其他公司,高通具备的是较强的综合能力。算法厂商缺少芯片和中间件,部分芯片厂商中间件所支持的算子和模型有限。孙力表示,AI Kit 还将推出骁龙 855 版本,载有专门的 NPU。

手机之外,3D 视觉的更大舞台

去年,iPhone X 带动了一波刷脸解锁的风潮,但却延续往年的引领者角色。在 Oppo、小米、华为悉数推出单款 3D 人脸解锁手机后,下半年,主流手机厂商基本放弃了 3D 深度视觉的方案,转向屏下指纹。

孙力认为,3D 视觉未能在国内的安卓手机市场推广开来的原因主要有二:

(1)物料成本高,方案刚上市时达到 20-30 美金,在手机市场价格战拼杀到现阶段来看,远不是大部分手机厂商所能接受度的价格。就算到目前为止,3D 模组的价格也没有降低到规模化的程度。

(2)多种的光学设计方案(ToF,结构光,双目,主动双目等)、安卓手机厂商和芯片厂商共同导致供应链和系统的碎片化,导致这样一套新方案很难在体验层面达到标准化。

但孙力仍然对 3D 视觉的应用方向保持乐观,他认为当具备以下三项要素后才是深度视觉技术普及之时:1)硬件方面,需要有丰富的 3D 摄像头采集图像,要足够便宜;2)拼接和建模算法,高精度算法;3)在此基础上,才是做 3D 的人工智能应用,比如物体测量、工业质检。

孙力表示,他更看好 3D 的人工智能应用。在工业场景下,需求已经非常明确。比如通过测量猪的体积来推断体重。孙力表示,「虽然听起来稀奇,但确实是真实需求,并且已经在大量使用」,通过 3D 视觉测量出猪的体积,因为圈养供应的饲料一致,根据肥瘦比基本能推算出体重,由此观察出猪的生长曲线。

另外,在需要测量大型物件的场景里,针对瑕疵的凹陷需要精确到毫米级别时,用 3D 视觉建模就能自动计算出结果。相比人力更安全和省力。孙力表示,在上述工业垂直场景中对于 3D 视觉的需求相比手机解锁更为直接和强烈,更适合落地。他表示,在工厂生产线都是 7*24 小时运转,机器和人工智能的介入能够带来显著的运转情况改善。

当 3D 视觉运用到具体工业领域,对于业务方而言还需要具备哪些必要条件,以及制约其发展的主要因素在于?

孙力认为在工业质检领域,对于企业而言,首先需要采集数据,这其中涉及到变量有采集到的数据的特点、采集的数量、采集的设备以及方式。

此外,还需要明确企业里的内部客户是谁?质量部门和研发部门的要求是不一样的。企业内部要一个能说话算数的部门进行管理和对接,将问题抽象出来,阐述清楚,制定有效的判定规则。如果问题无法定义清楚,那么算法工程师没法推进。比如面板检查,是检查存在坏点还是检查颜色不均,存在哪几类问题需要归纳出来。

最后,便是工作流程的梳理和再造。因为 AI 的本质希望减少人力,提升工作效率。那么,在 AI 应用所涉及到财务部门、IT 部门、质量部门、研发部门、工程管理部门、供应链部门等,都需要围绕这项新的生产力要素进行一定的流程改造。

实际部署过程中,流程改造通常是从一个小的突破口开始,当企业尝到甜头了,就会慢慢进一步推动下去,开始相信 AI 能够为他带来更大的回报。想要一开始就大刀阔斧基本很难,因为企业内部每个部门都有其自身的运转模式和体系。当他们对于 AI 没有足够信任的时候,可能前期还要花费双倍的经历,用人力和 AI 对比来验证是否可行。

等到验证可行,方案上线,有会出现新的问题。当企业的制造需求、供应链结构、工艺制程发生改变,原来的算法可能未必能泛化和适应新的条件,所以方案又需要新的部署和升级。不过,这种改变涉及到的人力影响就比较小了。因为现在只需要一两名员工就能服务机器,因为机器已经能够产生巨大的效率。而以前都是机器服务于我们。人服务于机器,人的作用是抽象现实中遇到的问题,让算法功能够实现,让机器代替人工。

 AI 芯片创业明年会更好吗?

谈到自动驾驶,孙力认为,纯视觉算法的方案将来一定会落地,但是相比激光雷达的融合方案可能会相对晚一些。

目前,英伟达优势在 AI 算力的强劲,其他厂商 TI、恩智浦、高通等,国内全志等厂商都在积极解决精准化问题。要实现基于视觉方案的自动驾驶,首先,摄像头和机器视觉算法的组合能够实现有效图像的采集;第二,是各个传感器图像的拼接,最棘手的问题在于环视摄像头图像的拼接,以及车内的驾驶员的行为分析。

面向汽车的嵌入式非常严苛,要经过第三方认证,每段代码都要检查,审核周期很长,十分考验公司的现金流。整合更偏向于 Tier1 厂商的领域,博世,作为硬件集成商,逐步降低这个成本,Mobileye、英飞凌、恩智浦,非常强的整合能力,现金流充沛。

在谈到 AI 芯片公司在明年将遇到更残酷的竞争时,孙力分析道,第一代做 AI 加速都是多采用手机芯片,采用类似 DSP 或者 GPU 进行异构运算,功耗比较大,但好处是容易快速出产品,供应链容易管理;作为只能出售 IP 的协处理厂商,可能会面向 soc 大厂商的竞争,比如高通等,以及 ARM 也做加速的 IP,从这个层面来看,想将 IP 卖给第一梯队的芯片公司这条路并不好走。

但是第二梯队的芯片公司存在需求,而 IoT 市场也是更大的空间,将手机架构的芯片用于物联网市场显然是冗余的,比如智能门禁的处理芯片显然是不需要 GPS 功能的。面对更细分市场的需求,大厂显然没法重新开设产品线满足,这些正是创业公司的机会。选择跟偏中低端品牌的芯片厂商合作,推出价格更亲民、功耗更低的物联网芯片——既保证智能化,同时控制成本。

产业机器视觉芯片
相关数据
高通机构

高通公司(英语:Qualcomm,NASDAQ:QCOM)是一个位于美国加州圣地亚哥的无线电通信技术研发公司,由加州大学圣地亚哥分校教授厄文·马克·雅克布和安德鲁·维特比创建,于1985年成立。两人此前曾共同创建Linkabit。 高通公司是全球3G、4G与5G技术研发的领先企业,目前已经向全球多家制造商提供技术使用授权,涉及了世界上所有电信设备和消费电子设备的品牌。根据iSuppli的统计数据,高通在2007年度一季度首次一举成为全球最大的无线半导体供应商,并在此后继续保持这一领导地位。其骁龙移动智能处理器是业界领先的全合一、全系列移动处理器,具有高性能、低功耗、逼真的多媒体和全面的连接性。目前公司的产品和业务正在变革医疗、汽车、物联网、智能家居、智慧城市等多个领域。

华为机构

华为成立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。华为的主要业务分布在无线、网络、软件、服务器、云计算、人工智能与大数据、安全、智能终端等领域,发布了5G端到端解决方案、智简网络、软件平台、面向行业的云解决方案、EI企业智能平台、新一代FusionServer V5服务器、HUAWEI Mate等系列智能手机、麒麟系列AI芯片等产品。目前华为拥有18万员工,36所联合创新中心,14所研究院/所/室,业务遍及170多个国家和地区。

http://www.huawei.com/cn
自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

激光雷达技术

自动驾驶车辆传感器的一种,采用激光扫描和测距来建立车辆周围环境的详细三维模型。Lidar 图像具有高度准确性,这使得它可以与摄像头、超声波探测器和雷达等常规传感器相提并论。然而激光传感器面临体积过大的问题,同时,它的机械结构非常复杂。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

物体识别技术

计算机视觉领域的一个分支,研究物体的识别任务

推荐文章
暂无评论
暂无评论~