Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

地平线到底有没有解开神经网络黑箱,这篇文章给你答案

在 2017 英特尔中国行业峰会上,地平线创始人余凯发表了演讲并接受媒体采访,这也是融资消息放出后,地平线和英特尔首次联合发声。

要说最近人工智能领域的「当红炸子鸡」,刚刚获得英特尔领投的近亿美元 A+ 轮投资的地平线机器人可谓当仁不让。瞄准无人驾驶软硬件解决方案的地平线,就此成为英特尔继 Mobileye 之后在该领域的又一次豪赌。

在 2017 英特尔中国行业峰会上,地平线创始人余凯发表了演讲并接受媒体采访,这也是融资消息放出后,地平线和英特尔首次联合发声。

地平线成立于 2015 年 7 月,创始人余凯曾任百度深度学习研究院 IDL 负责人,是国内最早一批从事自动驾驶技术的研究人员之一。公司在北京、南京、上海均设有研发机构,目前有超 300 名员工,其中大部分为工程师。业务着眼于嵌入式人工智能解决方案,方向瞄准自动驾驶以及图像领域。

摆脱对人工数据标注的依赖

演讲中,余凯针对地平线的核心业务——自动驾驶谈到了其近期的两个启发。

其一,在未来,自动驾驶将成为边缘计算的最大场景,同时也将成为云计算的最大场景,因为自动驾驶汽车需要地图以及大数据的支撑。

但同时,基于大数据的人工智能系统训练方法与人类学习世界的方式有很大的不同。比如机器需要从成千上万张图片中学习才能辨认猫,而小孩子只需要一两张照片就够了。

这种情况放在自动驾驶领域是非常危险的。因为衡量一个自动驾驶系统的可靠性、安全性、稳健性的实际指标,是在交通意外发生时系统的表现,而意外本身是小数据。因此,怎样在小数据的情况下进行学习,是人工智能、自动驾驶所面临的根本问题之一。

在余凯曾经供职的百度,搜索业务是其重点。为了提升搜索的相关性,百度从用户的点击行为中获取训练数据,将用户的搜索数据、点击数据、未点击数据相结合,形成三元组训练样本。

将百度的经验移植到自动驾驶领域,余凯看到,司机每天都在做判断、避障、想方设法保证自己的安全,这其实就是天然的应对突发状况的训练数据,需要善加利用。

其二,AlphaGo Zero 采取左右互搏的强化学习方式,能够在不使用任何人类棋手数据的情况下自我学习。从中,余凯看到在仿真平台上运用虚拟数据对无人驾驶车辆进行训练的价值。

「仿真平台的的数据量是物理平台的一千多倍,」余凯表示,「在数据量的差别之外,更重要的是在虚拟的世界里面,我们敢于进行在现实世界中不敢尝试的路况实验。」

以上两点启发都关于数据,总结起来就是,无人驾驶系统既要从用户的实际行为中学习,也要从虚拟仿真平台中学习,而不是单纯地依赖人工标注的训练数据。余凯认为「这非常重要」。

两大技术亮点,让无人驾驶更安全


此外,机器智能注意到演讲中余凯所提到的两个技术亮点。其一,地平线解决了自动驾驶领域的黑箱问题。余凯表示,对于自动驾驶汽车来说,软件框架必须保证透明性以及可追溯性。也就是说,如果一辆自动驾驶汽车在路上出现某一个不完美的行为,或者某一个奇怪的决策判断,我们需要知道原因。

但当前的深度神经网络是一个黑盒子,这意味着我们没有办法保证自动驾驶汽车的绝对安全,也找不到提升系统性能的方法。余凯表示,其雨果平台将贝叶斯网络与深度神经网络相结合,将其自动驾驶系统变成一个透明的可理解的白箱系统,一方面提升安全可控性,另一方面能够不断优化技术细节。

「一定要思考软件系统的透明性,而不仅仅停留在它预测是否准确的层面。」余凯认为,「人与机器的共存,要求我们充分掌握机器所做的每一个动作背后的原因。」


其二,地平线展示了其基于英特尔 A10 处理器的伯努利架构。基于该架构的道路物体识别系统能够以像素点的形式描绘道路景物,而非惯用的锚点连线形式,且该系统能够在终端芯片运行。

余凯表示,通过更清晰地判断人脸朝向、整个身体的姿态动作,伯努利架构能够让系统更准确地判断行人未来 5 秒内的前进方向,这关系到系统的路径规划以及决策。「人大概率不会往脑袋后面走。」余凯说。


基于以上两个技术特点,地平线推出了国内第一款自主代客泊车系统。余凯看到了当前的停车难题,认为商场地库的自动驾驶系统是无人驾驶落地的天然场景。「中午和朋友出去吃饭一共一个半小时的时间,找车位可能需要四十分钟。」他说。

使用地平线的自主代客泊车系统,用户可以在到达商场后下车,将寻找停车位的任务交由车辆完成。除代客泊车外。该技术也能够被应用到其他场景,例如电动汽车自动寻找充电桩,共享出行汽车自动寻找停靠点。该技术将在试运营两年后,也就是 2019 年大规模产品化。

在人工智能时代,芯片巨头英特尔押宝 FPGA 和 ASIC 架构,认为低功耗以及前者的可编程性是俘获用户的杀手锏。余凯对此也表示了赞同,并称:「未来自动驾驶的硬件平台需要在软件任务上充分优化,很难有一个固定的硬件架构适应软件的不断发展,FPGA 的可重塑性能够灵活满足软件的优化需求。」

谈及与英特尔的合作,余凯表示,双方的合作开始于 2016 年 11 月,至今已有一年多的时间。地平线在英特尔的 FPGA 上实现非常复杂的计算,在 ASIC 上开发软件和硬件系统。

早在今年一月于拉斯维加斯举办的国际消费类电子产品展览会(CES)上,地平线就与英特尔联合推出 ADAS 系统,可实现在高速公路和市区道路场景下,同时对行人、车辆、车道线及可行驶区域的实时检测和识别,此番也是地平线首次公开对道路可行驶区域的检测和识别效果。

在媒体问答环节,余凯就无人驾驶的技术、场景与政策等相关问题发表了看法,以下为部分问答整理:

地平线与 Mobileye 的异同点是?

我们和 Mobileye 更多的是合作与互补。我们更多地考虑中国的国情,比如自主泊车这个需求在美国就不大。美国的主要场景是高速,美国人普遍是在一个小城镇生活,在另一个小城镇工作。而中国的主要需求在于城市道路,我们工作和生活都在同一个城市。因此我不太看重高速场景,甚至我觉得辅助驾驶对于用户来讲价值也不大。

中国交通有两个痛点,一个是停车,一个是堵车,这是我认为两个比较重要的场景。对于这两个场景呢,我们的理解也和别人不太一样。很多人理解自动驾驶是人在车上的自动驾驶,而自动泊车,是人下车后的自动驾驶。

这个想法首先满足了我们的刚需,其次也规避了一些政策法规的问题。法规我们可以推动,但不能决定。对于企业来说,不能决定时间节点的事情是很可怕的。

另外我们的场景着重在人下车后,那么车可以慢慢走。所以自主代客泊车这个场景,无论是从现实需求还是从技术可行来说都是通的。

怎样看待当前 AI 领域的不同芯片架构?

 

我认为一些特别固定的计算可以使用专业硬件,例如图像识别任务会逐渐演变到用专用芯片处理。但同时为了保持灵活性,以及适应软件架构的演进,整体系统还是需要一个异构的平台。

具体到无人驾驶领域来说,多传感器融合是非常重要的技术模块,我认为 FPGA 会比较适合。多传感器融合的硬件方案在很长一段时间内会保持不确定性,而且传感器技术本身也在不断发展。不同的传感器会有不同的数据带宽,对硬件的灵活性要求很高,因此我们会在很长一段时间内保持 FPGA。

刚刚讲到图像识别会逐渐演化成专用芯片,但是现在有一个趋势是图像与雷达融合进行识别,因此图像识别模块也将有一段时间保持灵活。

长远来看,我认为各种硬件架构将在很长一段时间内保持并行,也就是说 ASIC、FPGA、CPU、GPU 都会存在。

伯努利架构能够支持像素点级的图像识别,同时又能在终端芯片运行。这其中涉及到的计算以及功耗问题是如何克服的?

最核心的是软硬件配合。现在的人工智能计算,通常情况下硬件平台利用率只有 30% 左右,其他都是空耗。所以如果做好软硬件适配,平台运转自然高效。我们的硬件利用率一般能够达到 98%,能够用原本的空耗做更加复杂的计算。

雨果平台将贝叶斯网络与深度神经网络相结合,是否意味着深度神经网络的黑箱问题被解开?其他领域(例如图像、语音)是否能够复用?

我觉得二者的结合是一个方向,但不能说黑箱已经被解开。比如说深度神经网络它也是一个方向,我们不能说深度神经网络将语音识别的问题解决完了。我觉得这是一个大的框架,其中还有很多细节需要研究。

中国道路状况复杂,是否意味着在中国训练的无人驾驶系统放之四海皆可用?


是,也不是。每个国家都有不同的挑战,比如德国最大的挑战是道路车速快。在中国的城市道路上行驶,车辆一旦遇到问题,可以进入紧急的预案程序,打开双闪停靠路边。但是在德国的道路上想要减慢车速停车,是很危险的。

如何看待人工智能行业的泡沫?

我认为,如果你用过去的公式计算现在的情况,可能会得到泡沫。但如果你用未来的发展看现在的话,你就会觉得现在的情况很合理。

世界总是在非线性发展,比如在 Facebook 刚刚成立一年的时候,给它估值几个亿美金,人们会认为很合理。但是现在,当它已经估值 5000 亿美金的时候,再回过头来看,还是否觉得合理?当时错过它的投资人可能会非常后悔。

因此从过去出发和从未来出发,会得出不一样的结论。

怎样看待目前计算机视觉公司比自动驾驶公司估值高?

计算机视觉确实应用范围很广,而且对信息的抽取维度也很深刻。人类大脑获取的信息有 80%-90% 都来自视觉。从价值来看,我认为作为信息入口,计算机视觉的地位确实很重要。

但是我认为不能单纯地这样比较,自动驾驶公司成立的时间普遍较短。拿成立一年的公司和成立五年的公司比估值,肯定不合理。今年下半年,市场在自动驾驶方面的投资可以说是第一大。有的公司成立 6 个月就被以 10 亿美金收购,听说从百度出来创业的自动驾驶公司就有十几家。

在自动驾驶政策方面,国家持怎样的态度?地平线有怎样的诉求?


政府在无人驾驶方面是很积极的,并不保守。我的感受是政府在尽其所能的,在不出现重大安全事故的前提下,鼓励创新型企业向自动驾驶的方向发展。

国家非常重视核心技术,以及是否有支撑性平台。具体到与地平线的沟通,国家关心的是自动驾驶的处理器、操作系统、云计算底层架构等平台性技术。

至于我们的诉求,在人才方面多给几个户口,以及多搞一点场地测试的机会。

目前已经与一些车场展开合作了吗?搭载地平线硬件的汽车将在什么时候落地?


我们与国内的主机厂基本都有合作,我们的停车场里停了很多辆他们的车,此外,我们和日本、德国、美国的主机厂也有合作,其中与美国主机厂的合作就是英特尔促成的。

汽车的生产周期很长,我们现在与主机厂合作研发的都是 2020 年以后的车型。因为汽车的技术方案在量产前三年就已经确定了,再加上之前两三年的研发过程,因此普遍来说会有五六年的时间差。到量产前三年的时候,供应商是谁、采取什么样的方案,已经全部都定下来了。而且代码也都是充分测试过的,一行都不能改。

为什么选择英特尔作为投资方?


我认为英特尔实际上是自动驾驶领域的实力之王——5G、FPGA、CPU,还有 Mobileye。所以说从逻辑计算到人工智能计算再到 5G,英特尔的覆盖是非常全的。

而且英特尔的生态是非常开放的,它希望所投的企业能够充分的发展。因此英特尔不会对我们有一些限制,比如减少对 GPU 的使用,我们有非常充分的自主选择权。

地平线会考虑被车厂收购吗?


不考虑,我们还是想要服务整个行业,所以我们在坚定地走核心技术供应商的道路。我们不会在哪个城市部署三万辆车运营,也不会在机场部署自己的车,或者自己造车。我们只是想服务运营商。

产业地平线机器人余凯创业公司自动驾驶英特尔
暂无评论
暂无评论~