Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

魏雨蘅 作者

特斯拉死磕「视觉感知」撤下雷达,真的靠谱吗?

近日,特斯拉CEO埃隆马斯克在推特上分享了一些关于特斯拉V9.0 FSD的消息,表示测试版本会在最近一到两周发布,大规模测试则需要等一到两个月。「但是这件事情很难预测。」马斯克表示,他还对今年年底在欧洲发布正式版的V9 FSD和智能召唤功能持乐观态度。

图片

 马斯克提到V9版本的FSD将会解决之前饱受诟病的故障「幽灵刹车」,这个问题在2020年经历过多次升级后仍未得到解决。「幽灵刹车」指的是开启FSD之后特斯拉汽车在经过桥洞这样有大面积阴影的路段时,系统会把阴影误认为是障碍物而突然减速,从而影响交通产生安全隐患。

 他也提到最近特斯拉正在把重点放在移除毫米波雷达上,他希望今后特斯拉的辅助驾驶将会是纯视觉感知的。「我们正在把重点放在移除雷达和保证安全上,下周将会在美国投入生产,V8和V9版本的差别将是巨大的。」

 据外媒报道,早在三月,马斯克就表示过「纯视觉感知才是通往真实世界AI的道路」,他认为视觉感知的精准度远超雷达:比起雷达,视觉感知的速度bit/s也高出好几个量级。三月底,特斯拉发布了一项新专利,专利中介绍了一种新系统,该系统仅利用两个神经网络来使用图像数据,即可准确测量物体间的距离,其中一个神经网络根据摄像头捕捉的画面来测算距离,另一个神经网络通过对图像注释来给第一个神经网络提供学习数据。专利中也写道如雷达,激光雷达这样的视觉传感器成本太高,并不适合装备在大规模生产的车辆上。

图片图选自特斯拉专利

 自动驾驶的关键技术可分为感知,决策,控制三个部分。马斯克心心念念的纯视觉系统就是感知系统的一种。感知系统是以传感器数据以及高精度地图作为输入,经过计算和处理达到对车辆周围环境进行精确感知的系统。随着自动驾驶等级升高,人工干预变少,对感知系统的要求也变得更高。现在市场上两种主流的自动驾驶感知方案是视觉感知与激光雷达感知视觉感知是以摄像头为主导,各种雷达作为辅助;激光雷达感知技术是以激光雷达为主导,毫米波雷达、超声波传感器及摄像头作为辅助。

 激光雷达流派认为,摄像头做主导的视觉感知精度不够,如果自动驾驶要发展到L3级别以上,就应当采用激光雷达。其优点在于超长的探测距离与极高的精准度,而且激光雷达可以主动检测周围环境,即使在夜间光线不好的情况下,也不会影响探测效果。不过,激光雷达无法识别颜色,且无法对目标进行追踪。在高速移动状态中,雷达所需处理的数据是海量的,这会导致其精度下降。有时,激光雷达还需要单独接入外部适配器进行充电,使用起来比较繁琐。

视觉感知的优势在于,摄像头获得的画面与人眼是相似的,成像技术的发展也意味着摄像头捕捉的图像内数据更加丰富。而且,摄像头可以对物体进行分类,这是激光雷达做不到的。但是与激光雷达相比,视觉感知的弱点十分明显:摄像头十分依赖光照条件,无法感知距离导致对算法、算力的要求极高。

图片

 目前,市场上使用摄像头主导技术的只有特斯拉、百度Apollo等少数企业,其余大部分自动驾驶企业使用的都是激光雷达感知,原本与特斯拉一起研发视觉感知的Mobileye也从2018年开始在测试车辆中加入激光雷达,甚至在今年年初还推出了激光雷达芯片。

特斯拉如此执着于视觉感知,很大原因是由于马斯克认为激光雷达的「成本过高,结构比较低级」,他曾在2019年4月说过:「激光雷达和高精度地图都是自动驾驶中错误的解决方案, 只会减慢自动驾驶商业化的速度。如果你只是在限制区域行驶,那也不能叫做自动驾驶。」他还认为激光雷达没有发展前景,所以特斯拉开始摒弃激光雷达,潜心研究视觉感知算法。

然而,那已是2019年的行情了,现在的雷达技术与那时候相比可谓是一个天上一个地下。 

激光雷达主要分为三种:机械式雷达,全固态雷达,半固态雷达。两年前占据主流地位的是机械式雷达,然而它的两个短板导致其并不适合大规模商用:结构不稳定,成本高。例如,得到福特和百度投资的激光雷达公司Velodyne早期的64线机械式激光雷达售价高达8万美元。并且机械结构十分复杂,平均失效时间仅为1000-3000小时,远低于汽车行业13000小时的最低要求。

图片

近期,由于固态及半固态雷达技术的发展,他们开始广泛地被应用在智能汽车上。上海车展,小鹏P5更是抢到了「全球首款量产激光雷达智能汽车」的称号,包括蔚来,WEY在内的多家厂商也推出了搭载激光雷达的车型。

固态与半固态雷达依靠光学相控阵列、光子集成电路以及远场辐射方向图等电子部件代替机械旋转部件实现发射激光角度的调整,这使得固态半固态雷达比机械式雷达的体积更小,成本更低,非常适合进行大规模商业使用。全球科技创新产业专家王煜全表示:「激光雷达即将进入成熟期,比拼的是成本优势、规模优势。成本优势带来规模优势,规模效应会进一步促进技术成熟,技术成熟推动成本降低,产业得以良性循环。」

 特斯拉的人工智能和自动驾驶总监曾表示:「在某种意义上,激光雷达是一个捷径,他回避了对自动驾驶非常重要的视觉识别基本问题,给人一种技术进步的错觉。」虽然视觉感知确实可以对物体进行分类,但是特斯拉在自动驾驶开启之后频发「无法识别白色物体」的问题,今年三月在底特律仍然有同样原因的事故发生,这证明现如今特斯拉的算法在物体分类方面并不是足够成熟的。

图片

 2019年,禾赛科技等公司发布低成本雷达技术;2020年8月,大疆旗下公司览沃科技发布可以量产的千元级车用激光雷达;就在今年年初,禾赛科技站上了中国激光雷达第一股,华为日前也发布了仅为200美元的激光雷达。据启信宝数据显示,目前我国雷达相关企业共有1.4万家,2020年新注册企业2640家,同比增长29.3%。海外激光雷达方面的布局进行得更早,谷歌早就成立了无人车部门现在成为了可以售卖激光雷达的Waymo;Velodyne已经登陆纽约证券交易所;Luminar已经与全球十大车企中的7家都建立了合作关系。

图片华为激光雷达

 目前激光雷达技术发展得如火如荼,特斯拉的纯视觉感知方案若是想在众多激光雷达感知方案中杀出一条路,恐怕需要在算法方面有长足的进步才行。相关专家也对Auto Byte表示,单纯依靠视觉感知技术,对算法和数据的要求太高。另外,美国也难以形成中国这样的基建能力,同时当地针对车路协同的建设成本也很高。如果特斯拉对成本敏感,撤掉雷达可以是一种思路,但至于实际能达到什么效果……还只能祝参与测试的车主们好运。

产业毫米波雷达视觉感知特斯拉
相关数据
感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

百度智能云机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://www.baidu.com
推荐文章
暂无评论
暂无评论~