所谓的L4无人车体验, 其实糟糕到让我怀疑人生

作为一名科技记者,现在再看自动驾驶,再也没有 3 年前像彭博社一样用 3 篇连发稿件「热烈祝贺」Uber 无人车开上匹兹堡街头的兴奋感。

实话讲,当技术公司因为媒体嘴里喊着「自动驾驶凛冬将至」而愤愤不平时,可能自己也没想到,那些合作仪式上剪的过量彩带、调过速的视频(还有调到 16 倍速的)以及「202*年的诺言」其实就充当了让质疑声越来越响的催化剂。

因为总有一天,我们是要上车的。

或者严肃一点儿来说,对所有技术公司而言,自动驾驶是一门 2B2C 的生意。所以,请大家重视那个 C。

http://pic.rmb.bdstatic.com/6f41bc9f4dd6e17350640dc57c5896a22927.gif

因此,就在我一年多来坐上了许多号称限定环境内的 L4 级自动驾驶车以后,那种因视频而产生的「欣慰之情」不仅荡然无存,反而让我沮丧到开始怀疑人生:

园区内全自动驾驶?那就龟速行驶,体感极像公园里的有轨小火车。已经在全球很多城市运行的各家公司的自动驾驶小巴,有一些能让我轻松徒步与它并肩前行。在这种速度下,与其考虑车撞人,不如考虑人撞车(反正我实在受不了速度,就试着去撞了,掐指一算应该用身体撞过五六辆小车了)。

高速公路上的高速自动驾驶?可能连车道保持都勉勉强强,有时候还抖成筛子。大家见过电视购物里那种甩脂机没?功效如出一辙,想懒人式无脑减肥可以尝试一下。

完全cover普通道路的L4级车?安全员接管率高到纯粹就变成了一名司机。当然,我们要理解程序猿与安全员的苦闷和无奈——

国内办公区和住宅区附近哪里不是车堂而皇之就成排停在车道上?路上的停车位比行驶空间还宽,刮蹭了车还得上社会负面头条新闻,无人车有什么罪。

所以,当我一次次在望京大山子地区最拥堵复杂的路口止步不前、仰天长啸时,愈发对一句话深信不疑:

「如果你爱这辆无人车,就请把它送到大山子;如果你恨这辆无人车,也请把它送到大山子」。

感知能力强?在一次L4级无人乘用车快戳上前方公交车屁股才做出急刹车的反应后,后座没系安全带的我,身体被带离座位并做出了一个悬空向上的高难度弹跳动作(请自行脑补),脑袋最终大力砸中车顶(感觉没车顶的话我可以直冲云霄)。因此我强烈建议,在刹车体感如此感人的情况下,给车顶也装个安全气囊实为一种物理补救的上上策。并且,任何试乘试驾都请系上安全带。

每每这个时候,我脑子里就会重新过一遍两年前一位 Waymo 工程师说过的话:

「那些我们总是觉得够充分的 N 层安全冗余,在现实场景下总是被一层一层剥地连裤衩都不剩。」

这话放到今天,不由感叹仍然是这么让人想击掌点赞。

http://pic.rmb.bdstatic.com/ad7904a4a9c37297fcba1227680a6bec9529.gif

当然,一些好的试乘项目也会让人眼前一亮,但大多数名不副实的体验犹如一次次把榔头毫不留情地夯在了我的脑袋上——

不仅让我愈加清醒,也开始真正督促我把关注焦点从虚无的技术描述转移到无人车的性能、实测表现与乘坐体验上。

然而,自动驾驶的技术在这头,用户体验在那头,中间的位置,我一直好奇到底是谁能扛起把「程序员语」翻译成人类语的大任……反正不是 PPT。

或许,一个专属于无人车的产品经理才是正解。

1 、自动驾驶也有产品经理?!

实话讲,我从来不知道自动驾驶汽车来也有产品经理,直到我在百度上周的 AI 开发者大会上转悠了半天。

其实有点可惜,即便这场技术会议在两天内的热度比他们前几届大会的总和还要多得多(这梗就不提了),但这个效果跟技术没半毛钱关系。

大众照样对人工智能一知半解,对无人车的认知也顶多停留在Demo 视频里。

而现场也证明了的确如此:

聊代码和芯片功耗聊到 high 的开发者们用表情和专业术语告诉我,技术,仍然是一小部分人的狂欢。

坦率讲,当自动驾驶论坛里的工程师用各种参数来描述阿波罗平台升级到 5.0 的好处时,坐在一群开发者中的我,不得不一边装逼点着头,一边竖起耳朵听周围程序猿的即兴评论,但心理活动则是——

为毛他讲的每个字都能听懂,但是组合起来就是不懂。

http://pic.rmb.bdstatic.com/d3eb80b630a2a01faf8fd2e9378f2f874836.gif

无论是「新增加的数据流水线」,还是「全新的路径边界决策与优化算法」,亦或是「增强的感知能力」,对于开发者来说,或许值得上手一试(嗯,没车也可以试);

但对于普通大众,判断标准只有一个——感官。

http://pic.rmb.bdstatic.com/7872721f9192c452b5b30ee829b645392965.gif

没有得到答案原本准备放弃的我,竟然在无人车展示区「找到了组织」。

是的,我遇到了一位产品经理(我问了三遍,他明确表示自己是一名无人车产品经理)。

「其实技术平台的这一套东西我们也不太清楚,」这位耿直的产品小哥没想到一上来就「自露家底」,

「我们可以说,技术升级有助于这辆车的性能升级,但是前者是后者的充分条件,不是必要条件。」

他承认,即便是 1 年前,技术上所谓的升级与实际效果仍然有不小的差距,而现在每次随车测试,与以前相比已经「进步不小」:

「说实话以前变道其实蛮傻的,要么对道路标线识别错误找错变道时机,要么『前瞻后顾』迟迟变不了道。

但现在要好很多了,接管次数也明显变少。」

不过仔细一想,ADAS 都诞生多少年了,但是包括「自动变道」「车道保持」「自动跟车」等一系列对大众来说已经完全不陌生的汽车 ADAS 功能,仍然都做得不尽如人意。

「急刹的话,可能是纵向控制没有做好。」他听了我对一次糟糕体验的描述,试着进行了解释,

「一方面,沿着我前进方向(纵向),可能对于前车的速度估计不准;也有可能是我的速度规划不好,在没有必要刹车的情况下刹的力度大了,然后慢慢减缓;

当然,也有一个情况就是,传感器判断错误或者失灵了。」

他认为,纵向算法做的不好,很容易出现体感问题,这是在基于他们内部每周体验报告得出的一个基本结论。

「我们有个专门的项目就是只针对无人车的舒适度进行跟踪取证。每个星期有特定的人员去坐车,然后给出一个主观评价。最近其实倒是没有这么频繁了。

有些体验结果其实非常类似,而指向性也特别明显,譬如因为识别错误和位置误差导致的急刹并不少见。」

除了急刹,我也从他那里找到了那次体验别人家无人车在路上走 S 路线(画龙)以及时不时发生抖动的「病根」。

「画龙其实就是横向漂移,也就是(他们家)定位没做好,特别是一些主要依靠 GPS 的方案,其实很悬;

而车有时候的来回抖动,包括在上下匝道时,其实也跟定位有关系。偏离一点然后又给抖回来了,来回抖,来回调。」

他认为,这些问题在一定时间内都可以解决,但是解题也有难易之分,比起纵向控制(油门与刹车),横向控制问题(方向盘)难度更大。

「面对复杂路况,最主要的还是考验你变道的能力。目前来看,汽车纵向控制的能力大家实际都差不多了,加速减速以及定速其实都很简单。

但是一涉及到横向控制能力,譬如变道,譬如路口转弯,假如把各家的车放在一起对比,每家公司还是有很大差距。」

譬如,曾有一家技术公司明确表示过国内的无人车并没有跟国外相同的「无保护下左转弯难题」,这个说法遭到了产品小哥的怒斥:

「让他试试在北京的那种大路口来一次左转弯。

我们跟过无人车的路测人员都被很猛地切过车,特别是左转弯,被各种切。

左转弯,你要考虑对面的车,还得考虑同方向的,同方向的有人会从你的内弯超车,还会从外弯超车,开过车应该都知道(作为一名无驾照但骑自行车在大路口进行过左转弯的社会人士,我觉得左转弯也挺危险的……)。而且有些地方还要遵守左转弯待转区的停留规范,一不留神就会扣分。

所以,国内的『无保护左转弯』难题是切实存在的,也是我们致力于去解决的。」

当然,让他更无奈的,还有许多非常具有本土特色的交通现象,以及司机们之间独特的相处模式。

譬如密度较高的施工点,譬如路边各种胡乱停放占用车道的车,譬如有老司机就是想故意别你车,再譬如与摩托车和小三轮的相爱相杀……

「很多时候你不能怪安全员要接管过来,我们其实已经把最低容忍车距降到了 50 厘米,但是两边的车实在是太近了,这种碰撞和擦花车的风险实在太高。

另外没有办法的是,上下匝道的限速我们是遵守了,但是人开的车可是没一辆遵守限速的。

我们有经历过在前面开着开着,后面的司机开始使劲鸣笛和骂人,没办法只能司机接管过来开道。」他忍不住开启了吐槽模式。

所以,现在你应该能充分明白为何所有技术公司总要给无人车的发挥场景来一个「限定」。

也应该能明白,为何连号称「地表最强」的谷歌,要选择在地处沙漠气候(雨比金子还贵),城市环境类似国内高新技术开发区(人口密度低,基础设施非常新)的凤凰城运营无人出租车。

基于各种主观与客观因素的试炼后,产品经理小哥眼中的无人车评判标准其实只有一个:

「是否足够像人」。

这里当然不是说「要跟人做的一样好」,而是要让车尽可能像人一样思考。

「我们之前曾频繁遇到这样一种情况,右前方有车压线,我们过不去,只能干等吗?

如果是人的话估计就借个道拐一下就过去了,可车是『直线思维』,一开始就是在那里干等的,要么就让人接管过来先过去再说。

但是为何车就不能具备人这种思路呢?

所以我们在对算法进行优化后,是允许车在某些时候偏离车道中心的,这里的术语叫 nudge,意思就是稍稍偏离一下借旁边车道的一小部分先过去。

有非常多的场景,如果你完全按照交规是根本没法开的,就比方你右转,那里有辆僵尸车等着你,你能会怎么办?

假如旁边就是有车来故意怼你,你应该怎样计算出车周围的最佳缓冲区?」

就像这位产品小哥所说的,无人车的所有行为都不应该是基于某一个固定规则的,而应该是基于不断去揣摩学习人类惯常行为的道路规划,这是一个动态调优的过程。

更深奥一点,就像刚才提到过匝道几乎不会有人遵守限速一样,想融入人类这个复杂的环境,无人车们就必须变得跟他们一样,成为「乌合之众」的一员。

http://pic.rmb.bdstatic.com/31ba75d99757cb911f732ff3192717293187.gif

「算法本身就是具有灵活性的,这应该是我们值得庆幸的。目前阶段千万不要指望用无人车来改变人类的习惯。」

2、「与其依靠纯视觉,指望激光雷达降成本可能更靠谱」

最近,百度在全球顶级学术会议上发布的基于 10 颗摄像头的纯视觉 L4 方案曾引起过不小的轰动,这在某种程度上也被一些人解读为是一种对马斯克「激光雷达无用论」的附议和讨好车企的举动。

然而,在百度大会展台上摆着的,仍然是一辆头顶禾赛科技 40 线激光雷达的四门轿车。

「这个版本的车是百度的主流方案,L4 纯视觉仅限于研究,商用目前不可能。」

「或者可以这么说,与其我们期待纯视觉做到 L4 能商用的程度,还不如期待一下降低激光雷达的成本靠谱。后一条路可能会更快,而且可靠。」

在产品经理看来,两套方案在高速公路上的可靠性差距其实非常大。

「以高速公路为例,大家都知道高速公路因为行驶速度,非常受制于传感器的覆盖范围。范围肯定越远越好,这样给传感器的预判时间才能充足。

激光雷达,我们自己的有效感知范围可以做到 200 米。

但如果是做到 100% 把握,其实核心感知范围是 100 米。

而纯视觉方案,能做到 100% 把握的范围更小而且本身也不稳定,假如遇到边缘案例,没有冗余的前提下就是致命的。

因此,做到高速公路上的 L3 级以上,目前是不可能的。

当然,这里千万不要把它跟某些特定的高速公路 Adas 功能混为一谈。」

事实告诉我们,对这番话最有力的证明,莫过于特斯拉。

虽然这家公司的车已经被人拿出来当靶子太多次,但我们还是不得不提那起被誉为「最佳传感器配置反面教材」的 2016 年致命车祸。

这起案例之所以「经典」,可以一言以蔽之:

运动中的障碍物「完美」避过了车体现有感知层的所有硬件安全冗余。

密歇根大学教授 Brandon Schoettle 曾在 2017 年又对这一经典案例做了感知层面的有趣总结:

「另一辆车(障碍物)进入传感器覆盖区域相对较晚。在没有激光雷达的前提下,这辆车首先应该进入远程毫米波里雷达的探测范围,然而却恰好一直擦着它的覆盖边缘(无论垂直还是水平都没有);

接下来进入摄像头的范围了,然而识别出了问题,距离与视场限制了识别对象的完整性,这就是为何白色车体被识别为漂浮着的云。

到最后一层硬件冗余——短程雷达(超声波)的时候,已经来不及了,反应时间都耗尽了。」

这样的例子是否属于「边缘案例」(指极少数发生的情况)?

很难说,因为致命事故已经发生意味着大众不会把它当成一个特例。

(该图例以特斯拉 2016 年车祸为基础进行了适当调整后作为了一个通用案例用来解释「停车距离」这一概念,最终用来证明自动驾驶汽车的反应时间与传感器配置方案有直接关系。摘自 Brandon Schoettle 的报告)

也正因为如此,圈内对特斯拉自动驾驶方案的等级界定(无论是辅助还是升级后的全自动)一直颇具争议。

产品小哥很坦率地承认由于身份原因,不能过多评判这两套方案,因为单车智能无论怎样都会有疏漏。但他们清楚什么样的方案在什么样的场景下效果不行,也清楚在体验上到底有什么样的变化。

「我们究竟还做不到什么,阿波罗 5.0 的一个形容词就能说明问题——「限定」。已经升级到 5 了,但仍然是限定场景下的能力实现。

而如果说车厂们因为成本问题更偏向纯视觉的说法,其实也不尽然。他们偏爱的是 L3 级别以下的部分能力可以实现的纯视觉方案。

L4 以上的纯视觉方案,就不再是单纯的摄像头成本问题了,还有后面计算单元的架构、成本和车规问题。所以大家的统一口径是『正在研发中』。」

「那你觉得现在是否觉得大家其实有点儿在滥用无人车等级?」这是我的最后一个问题。

「这个级别本来在我们眼中就没有什么意义。技术公司(不管有没有实力)可以都说自己做的是 L4,反正他们最终不用为此付出什么社会责任;

而那些(不管有没有实力)说自己能量产 L4 无人车的车企,一定得有为此背负骂名的勇气。」

产业自动驾驶技术智能营销百度产品设计工程师自动驾驶汽车
相关数据
来也机构

「来也」是国内领先的人工智能交互平台,由常春藤盟校(Ivy League)归国博士和MBA团队发起,核心技术涵盖自然语言处理(NLP)、多轮对话控制和个性化推荐系统等。公司已获得数十项专利和国家高新技术企业认证。 来也的愿景是通过AI赋能,让每个人拥有助理。C 端产品小来是智能化的在线助理,通过业内创新的AI+Hi模式,提供日程、打车、咖啡、差旅和个性化查询等三十余项技能(覆盖400w用户和数十万服务者),让用户用自然语言发起需求并得到高效的满足。B端品牌吾来输出知识型的交互机器人和智能客户沟通系统,帮助各领域企业客户打造行业助理。目前已经在母婴,商旅,金融和汽车等行业的标杆企业实现商业化落地。

https://www.laiye.com/
Waymo机构

Waymo是Alphabet公司(Google母公司)旗下的子公司,专注研发自动驾驶汽车,前身是Google于2009年开启的一项自动驾驶汽车计划,之后于2016年独立。2017年10月,Waymo开始在美国亚利桑那州的公开道路上试驾。2018年12月,Waymo在凤凰城郊区推出了首个商业自动乘车服务Waymo One。

http://www.waymo.com/
激光雷达技术

自动驾驶车辆传感器的一种,采用激光扫描和测距来建立车辆周围环境的详细三维模型。Lidar 图像具有高度准确性,这使得它可以与摄像头、超声波探测器和雷达等常规传感器相提并论。然而激光传感器面临体积过大的问题,同时,它的机械结构非常复杂。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

感知层技术

IoT (物联网) 三层结构中的一层,用于识别物体,采集信息等感知类的任务;另外两层是应用层(Application layer)和网络层(Network layer)。

百度机构

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。 “百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。 百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://home.baidu.com/
推荐文章
暂无评论
暂无评论~