太浪编译

不能因为小钱赌上自己的命, 这才是Waymo对马斯克"激光雷达无用论"的正确驳斥



特斯拉万一压对了呢?那么Waymo激光雷达项目估计就得被砍掉。

编译 | 太浪

编辑 | 宇多田


作为马斯克口中的「傻子王」,Waymo终于发话了。

在马斯克大肆抨击激光雷达十多天后,Waymo高管在Google I/O 开发者大会上对其进行了公开驳斥。

「你可以想象只用摄像头进行自动驾驶,但你需要最好的摄像系统才能真正做到这一点。」Waymo首席科学家Drago Anguelov表示:「因此,这是一个非常大的赌注,你有可能实现它。但这非常非常冒险,而且没有必要。」



1

傻子论」:不用激光雷达的理由



半个月前,马斯克在特斯拉举办的「Autonomy Day」上,对激光雷达传感器大肆抨击:「傻子才用激光雷达,任何依赖激光雷达的人注定要完蛋。注定是这样!(激光雷达)是昂贵的、不必要的传感器。这就像有一大堆昂贵的附属品。比如,一个阑尾是坏的,但现在你有了一大堆阑尾,你会发现这太荒谬了。」   

如果你对激光雷达不太了解,我们先来对它做个介绍。

激光雷达是一种会发射激光的雷达,它把不可见的光脉冲发送到世界上,并计算出它们返回的时间。这使得它在低分辨率下呈现出黑色和红色的图像,但与每个像素间的距离精确。一些激光雷达还能告诉你目标弹开的速度有多快。这样,它就有了超人的视觉,尽管分辨率低,目前的高成本和更有限的范围意味着它不是在每个方面都优秀。

激光雷达将3D成像技术引入自动驾驶汽车计算机,是目前大多数其他自动驾驶系统的关键元件。目前,Waymo、Uber、福特、通用Cruise等公司将激光雷达与摄像头结合使用,让自动驾驶汽车了解道路和道路上的情况。

价格昂贵是马斯克抨击激光雷达的一个主要原因。

但目前,每个主要的机器人车开发商和大多数创业公司都使用激光雷达与摄像头和雷达相结合的解决方案。他们倾向于增加更多的雷达和一个或多个激光雷达,有些还添加了不同类型的激光雷达,甚至夜视摄像头。

之所以这么做,是因为在他们看来,现在并不是降低成本的时候。现在是最大限度保证安全的时候,并且要尽快实现它,以及首先进入市场。可靠性是关键。

从技术上看,在激光雷达+摄像头或者摄像头的选择上,前者是更快、更安全的路径。更多的信息,特别是更可靠的信息是更好的选择。

如果想仅仅使用摄像头,则必须在一定程度上理解一幅图像,接近人类用眼睛和大脑所做的事情。

没有激光雷达超人的测距能力,人类通过智能计算出与遥远物体的距离。我们知道人和车有多大,所以一辆车或一个人如果看起来越小,我们就知道它离我们越远。当我们移动时,我们通过这个物体相对于另一个物体移动的方式来推测距离。

当物体离我们很近时,我们也能从两只「立体」眼睛和通过眼睛聚焦光线的方式得知距离。这些都是有用的,但事实证明,人们只用一只能看到远处的眼睛就可以很好地驾驶——真正的关键在于正确理解场景

激光雷达无需任何理解就能知道万物之间的固有距离。它在这方面近乎完美。对很多事情来说,「赌上你的生命」是可靠的——而且必须如此。人们可以也确实将「理解」添加到激光雷达的方案中,但这并不总是必要的,因此,你可以更宽容地理解错误。

激光雷达可以在白天或晚上工作,而摄像头必须处理不断变化的外部光线。

Waymo激光雷达传感器的先驱)首席技术官Dmitri Dolgov承认早期版本的激光雷达「非常昂贵」。但他同时认为,这种高成本与大多数新技术首次开发时没有什么不同。

「从根本上来说,激光雷达并不昂贵。」Dolgov说,「我们已经大幅降低了从第一代到现在的激光雷达产品的价格。可以想象,随着规模的扩大,我们将节省多少成本。」

今年3月,Waymo宣布,将开始向不与该公司自动拼车服务竞争的客户销售激光雷达,包括机器人、农业、安全等行业的公司。这个额外的渠道可能会帮助Waymo通过扩大生产来提高规模经济,最终进一步降低其为自己的汽车生产零部件的价格。

2

纯视觉真的什么都能扛?


特斯拉在众多主流汽车制造商中独树一帜,只使用了摄像头+雷达的解决方案。马斯克表示,特斯拉的自动驾驶技术将完全依赖内置摄像头。

特斯拉选择摄像头方案的原因很简单,目前根本没有量产并能真正商业化推开的激光雷达

特斯拉现在在销售汽车,即使他们想装激光雷达,也装不上。但是,他们未来的计划也是无激光雷达的。

特斯拉决定只用8个摄像头(前面3个、每侧2个、后面1个)加上前面一个雷达和一些用于近距离工作的超声波传感器来解决驾驶问题。

但现在,计算机视觉还不是那么好。

在过去几年里,计算机视觉技术取得了一系列惊人的突破,每个人都在使用它们。但是,这项技术并没有可靠到能「堵上你的性命」的地步,至少现在还不可靠。问题是,这种情况是否会发生,以及何时会发生。

大多数人说「什么时候」而不是「如果」,特斯拉和其他人说,既然人类只用眼睛就能开车,那么,显然这是可以做到的。但我们旅行时只用腿,这并不是说汽车应该用腿而不是轮子。鸟儿扇动翅膀,但这并不能证明飞机也应该这样做。有时,机器的方法是赢家。我们还不知道答案。

早期的激光雷达非常非常昂贵,但正如很容易预测的那样,任何电子技术都不会永远昂贵下去。数十家公司正在建造新的激光雷达,其成本不会对出租车的成本造成任何负担,也不会对私家车的成本带来太大影响。

如果成本不是问题所在(特别是因为现在还不是廉价的时候),那么大多数开发人员都已经表明,更可靠的信息是一个显而易见的选择。

「一旦解决了视觉问题,(激光雷达)就一文不值了。」

马斯克提出了如下观点。他知道自动驾驶的问题很难解决,尽管他经常错误地宣称特斯拉很快就能解决这个问题。太难了,你需要非常非常好的计算机视觉来解决它。

大多数人都同意他的观点——他们认为激光雷达不能独自完成这项工作(尽管谷歌的第一代汽车基本上只用激光雷达和雷达就可以开得很好)。确实需要很好的计算机视觉来完成这项工作。

但如果按照马斯克所说的,计算机视觉就必须非常好,好到它可以为你做激光雷达能做的一切。就像人类的视觉皮层一样,它必须在各种光线下工作。它必须能够可靠地计算出所有东西的距离。如果它能做到这一切,那么你就不需要激光雷达了。如果你开发使用激光雷达,你就浪费了大量时间和金钱在一些你最终并不需要的东西上。

因为摄像头的分辨率更高,它们能看到彩色的东西、更远的东西——你的摄像头能做到这一点,甚至做的更好。

也许有一天他是对的。但没有人知道那一天是什么时候。我们知道不是今天,我们可以猜测可能是在2030年之前。但我们今天想制造汽车。我们知道,便宜的激光雷达很快就会出现。

特斯拉正在豪赌。他们押注,视觉上的突破将很快实现。他们希望自己成为实现这一目标的人,通过使用他们定制的神经网络硬件和从不断增长的特斯拉汽车车队中收集到的海量数据。其他公司则押注于一个更安全的赌注,他们认为,实现突破还有很长的路要走,而便宜的激光雷达更有可能出现。

即使在视觉能力达到良好的那一天,许多人仍然可能会选择保留非常低成本的激光雷达,据预测,激光雷达将在那个时候出现。它们所提供的优势永远不会为零,而且,完全「赌上你的生命」的可靠性基本上不需要任何妥协。

即使你可以用一只眼睛通过一个单色滤镜开车,你也不能这么做。你可以为了节省一大笔钱而放弃安全,但不能为了节省一点钱而放弃安全。

一个致命案例佐证了目前计算机视觉能力的缺陷。

上周,特斯拉因一起致命事故被起诉。在这起事故中,特斯拉的算法显然误解了车道标志,并将车驶入了道路和出口匝道之间的假「车道」。它直接撞上了防撞护栏,致使驾驶者当场死亡。

按照特斯拉目前的技术水平,它有时会错过车道标志。由于它的雷达和视觉算法都未能识别出这道屏障,所以它撞上了防护栏。

同样,这种情况有时会发生在今天的技术上。雷达可以看到它,但作为静止物体,雷达系统无法准确地分辨它们的位置,因此,当雷达从路径附近的静止物体反弹回来时,你不能每次都刹车。

更重要的是,计算机视觉系统无法识别障碍。有一种可能的假设是,它们只是没有受过检测这些障碍的训练,尤其是检测受损的;十多天前,一个普通的人类司机打破了这道屏障。

神经网络只能识别它们接受过训练的东西,或者类似的东西。特斯拉的网络训练有素,能够识别道路上每辆车的后部以及某些类型的物体,但在2018年,它们可能没有接受过这方面的训练。

它们继续开车,更糟的是,它们加速了,因为它们现在认为有了一条完全开放的新车道,这是自适应巡航控制在这种情况下经常做的。

激光雷达系统几乎肯定能探测到这个障碍。

如果是在安装了激光雷达系统的情况下启用Autopilot,激光雷达系统就会检测到那辆横穿马路、撞死Joshua Brow(特斯拉驾驶者)的货车。

激光雷达系统不需要知道它们前面的物体是什么,也不需要知道它在哪里,它到底有多大。适当的激光雷达/软件系统确实能更好地了解障碍是什么,它们与视觉相结合,将达到视觉无法单独达到的水平。

总之,解决视觉问题,让它告诉你激光雷达告诉你的一切,是一个非常艰巨的任务。不久前,很难找到任何一个人说这是迫在眉睫的。如今,也有这样的人,包括马斯克,但大多数人仍然认为这很难。

但特斯拉希望,他们能从特斯拉车队的汽车中收集大量数据,这将是找到解决方案的秘密因素。如果是这样,使用 Autopilot 驾驶,表明特斯拉仍然还有很长的路要走。特斯拉的 Autopilot 提供了一个屏幕来显示其感知系统的输出,任何使用它的人都知道它仍然相当不稳定。

诀窍是,你不需要解决视觉问题就能得到一个辅助驾驶仪Autopilot,你甚至不需要那么接近。

从99%的精准视力(可以成为一名不错的司机助手)到99.99999%的精准视力,是一个漫长的旅程,你可以用自己的生命打赌。

Sterling Anderson曾是特斯拉Autopilot的负责人,现在是Aurora的首席产品官,喜欢称他的老东家的方法为,试图通过建造一个更高的梯子到达月球。(马斯克确实对登月略知一二。)

3

马斯克如果押错了呢?


特斯拉的赌注可能会取得好结果。

想要持有自动驾驶股票投资组合的投资者可能希望同时拥有Waymo(如果可能的话)和特斯拉。这是普通多元化投资者的正确策略。

尽管赌注很大,但还是有一些安全网的。如果特斯拉无法用他们最新的硬件很快解决全自动驾驶问题,他们仍然有出色的电动汽车业务。

他们在电力传动系统和高科技汽车设计方面拥有明确的领导地位。他们的自动驾驶产品(autopilot products)将继续增加新的和出色的功能,即使它们不能在车内没有人的情况下沿着海岸开车,或者在你睡觉时把你的车开到另一个城镇。

有一些早期功能可以更容易地解决,而且可能不需要激光雷达,例如:

  • 停车场代客泊车

  • 在处理电子邮件时应对交通堵塞

  • 深夜低速行驶,最终,白天作业,将汽车送往充电站

  • 无人监督的高速公路驾驶,先是在稀疏的高速公路上驾驶,然后在更拥挤的高速公路上驾驶

  • 在预先批准的有限范围内低速运作

  • 更好的ADAS(高级驾驶辅助系统),让你开车时越来越难撞车

它们并不像机器人出租车(robotaxi)那样令人兴奋或者有利可图。但它们仍然非常有用,特斯拉可能是第一个实现上述一些功能的汽车制造商。(一些汽车制造商已经实施了无人监管的交通拥堵操作。)

如果特斯拉决定它需要激光雷达,在吞下一些骄傲后,它将需要对它们的汽车进行一些重新设计。

虽然前向激光雷达可能很难添加到后视镜的摄像头阵列中,但目前特斯拉还没有明确的地方可以安装低阻力激光雷达。它必须比现在的型号小。前向激光雷达是最安全的关键。

4

马斯克如果赌对,其他公司也不吃亏


人们在研究这个问题时常犯的一个错误是,忘记了其他公司并没有把全部精力投入到激光雷达中。

有和特斯拉一样热衷于神经网络和视觉的,他们只是想把神经网络和视觉与激光雷达结合起来,而且他们有资金在这两方面进行研究。

一个特别重要的竞争对手是谷歌的兄弟公司Waymo

几乎所有人都同意,在神经网络方面,谷歌是全球领导者。那些向世界传授深度神经网络新方法的先驱,如杰夫·辛顿本人,为谷歌工作。在围棋比赛中击败人类冠军的神经网络来自谷歌。Waymo有使用谷歌神经网络的权限,使用TPU神经网络处理器的权限。

Dolgov在Medium上的一篇文章中写道:

谷歌的人工智能研究人员也帮助 Waymo在通往真正的自动驾驶汽车的道路上起步。

深度学习开始起步时,Waymo自动驾驶工程师与谷歌大脑团队并肩工作,将深度网络应用于Waymo的行人检测系统。即使在早期,结果也是显著的ーー在几个月的时间里,能够将行人检测的错误率降低100倍,使Waymo的系统更安全、也更有能力在道路上行驶。

「我们使用TensorFlow生态系统和谷歌的数据中心(包括TPU)训练神经网络;TPU可以更有效地训练我们的网络,效率提升高达15倍。」

「凭借我们多年的经验,与Google AI的合作,以及强大的基础设施,我们比以往任何时候都更接近一个交通更安全、更容易、更便捷的未来。」Dolgov在文章最后总结道。

虽然马斯克宣称特斯拉的神经网络芯片是「世界上最好的」,但事实并非如此——谷歌的TPU更好,除了Waymo,其他人买不到它。

不过,没关系,因为在神经网络方面,硅谷有很多初创公司都在开发他们自己版本的「世界上最好的芯片」,你会在2019-2020年看到很多这样的公司。与此同时,英伟达的GPU可以做到这一点,性能超过特斯拉的芯片,但它们的功耗更高。

如果激光雷达明显是多余的,Waymo和其他几家公司将准备转移。

他们没有特斯拉的车队,但是有办法得到这些资源,尽管有时成本更高,而特斯拉聪明地让客户为收集数据和为特斯拉做测试的机会付费。 (Uber和Lyft还有更多的司机可能会为他们做同样的事情。)

如果正如马斯克预测的那样,激光雷达败了,特斯拉将拥有优势,但并非是不可逾越的优势。

他还必须确保自己下的其他赌注也能兑现——比如没有详细地图的驾驶——以及使用机器学习来做出战术驾驶决策,比如在十字路口使用哪条车道。他也(温和地)反对模拟测试:他们使用模拟测试,但不像Waymo和其他一些玩家那样广泛使用。

特斯拉可能仍需要在其软件成熟时调整其传感器。靠近汽车的地方,摄像头看不到,如果遇到恶劣天气,汽车侧面和后部也没有雨刷。即使在那些地方,激光雷达的爱好者也不会避开神经网络。他们使用神经网络理解激光雷达数据,就像他们用它来理解摄像头数据一样。 (它们也可用于雷达数据。)由于激光雷达的分辨率较低,这些神经网络更加简单和快速。

马斯克表示,特斯拉「明年」将有100万辆自动驾驶出租车上路,虽然特斯拉的叫车计划缺乏许多重要细节。

至于Waymo何时将其自动拼车服务Waymo One推向进行初始测试的凤凰城地区以外的市场,Waymo高管对具体时间守口如瓶。

「我们有一个路线图和将业务扩展到凤凰城以外的地区的计划。」Dolgov说,「但一如既往,我们的部署将以安全为前提。」  

参考来源:Mashable、福布斯、Wired





产业激光雷达
相关数据
Waymo机构

Waymo是Alphabet公司(Google母公司)旗下的子公司,专注研发自动驾驶汽车,前身是Google于2009年开启的一项自动驾驶汽车计划,之后于2016年独立。2017年10月,Waymo开始在美国亚利桑那州的公开道路上试驾。2018年12月,Waymo在凤凰城郊区推出了首个商业自动乘车服务Waymo One。

http://www.waymo.com/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

激光雷达技术

自动驾驶车辆传感器的一种,采用激光扫描和测距来建立车辆周围环境的详细三维模型。Lidar 图像具有高度准确性,这使得它可以与摄像头、超声波探测器和雷达等常规传感器相提并论。然而激光传感器面临体积过大的问题,同时,它的机械结构非常复杂。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

推荐文章
暂无评论
暂无评论~