我们想看看汽车用人工智能所面对的世界,却意外地走进安迪·沃霍尔

编译 | Rik R 刘燕

自动驾驶汽车的一项必备技能是看清周围的环境,不被幻觉错视所迷惑。一辆车的观察工具并非前照大灯,而是由金属、玻璃和塑料部件制成的特殊设备,并依靠大量的计算能力来保持视觉能力,否则,汽车的大脑便不能在正确的时间做出正确的决策。


通过博世( Bosch )公司提供的一个自动驾驶原型车,我们可以了解汽车视觉的工作原理,顺便领略德国的乡村景象。更意外地是,我们还看到原来安迪·沃霍尔与未来的交通图景之间会有这么多共同点。

20/20 虚拟视觉

这个原型车的外观看起来像是德国公路上随处可见的宝马 3 系列旅行车,那么它有什么特别之处吗?落座副驾后,我们注意到挡风玻璃上安装有许多摄像机、传感器和雷达,尽管我们被告知这次短途旅行只使用单眼相机。中心控制台有许多不同的输入端口,其上还装有一块附加板,仪表板上安装着一个平板电脑。

        

这种技术相对简单——至少理论上如此。安装有摄像机的挡风玻璃负责记录画面,并将图像发送到后座箱的计算机中。这些信息在到达车载大脑前,它们首先会被传输进英伟达公司生产的一个图形处理单元(GPU)中。仪表盘上的平板电脑只作演示之用。

人工智能帮助我们的原型车将周遭环境分为 19 个类别。每个类别都由不同颜色标识,看起来像一种波普艺术。它知道街道和人行道之间的区别,并能够识别各种各样的物体,例如交通标志、交通信号灯、行人和各类车辆,包括汽车、卡车和自行车。这辆原型车可以识别路况,像人类那样判断哪些情况可以安全驶过,哪些情况需要刹车。


这辆车能够以惊人的速度和准确度识别出前方路况;不会把路牌错当成一棵树或是一个玩滑板的小孩。想想就觉得不可思议:我们正坐在一辆驾驶技术与自己不相上下的宝马车中。

学习过程

原型车学习到的一切技能都来自于博世的研发部成员。


「我们有一个离线的训练过程,」研究工程师 Dimitrios bariamis 在与《Digital Trends》的一次访谈中解释道,「我们给汽车提供注释过的图像,比如:图像的这部分有一个行人,这部分是一条街等等。然后我们把这些信息输入到汽车中,并给它提供摄相机传来的图像,这些图像已经根据之前学习到的参数被处理过了。系统知道图像的这部分是一条街道,因为它看起来与之前在训练过程中看到的那种街道一样。」



Bariamis 和他的团队已经向该系统输入了成千上万张屏幕截图,这些图像是取景自德国各个城市的车载视频画面,比如慕尼黑、法兰克福和斯图加特。他们还使用了戴姆勒公司城市景观数据集( Cityscapes Dataset )中的图片,该数据集也把世界分成了 19 个类别。这些被注释过的图像会在汽车行进的过程中帮助其学习,即使是行进在一个之前从未到过的小镇。「人工智能生成未知事物,」Bariamis 告诉我们。

该软件甚至可以在暴雨天对周遭世界进行分类,但是它还没有在雪天被测试过。Bariamis 很乐观,他不认为雪会妨碍汽车视觉。现在,他的团队已经确定,限制汽车视觉的因素只与它之前是否见过这种路况有关,还包括一些硬件问题。例如,该系统之前从未「看到过」公路的样子,那么它可能就无法识别出一个收费站。还有一种情况是,比如鸟类的分泌物遮挡住了摄像机镜头,那么该车也会失去视觉能力。

该项目由博世前瞻性思维研发团队负责,下一步推进方案完全取决于该公司的研发团队以及客户需求。

      

Bariamis 告诉我们,这种技术可以与较为基础的驾驶辅助功能进行集成,比如自适应巡航控制、高级半自动软件,甚至全自动汽车。最重要的是,它可以经过适当修改来用于各种用途。上文介绍的视觉软件是将世界分为 19 种颜色,但如果你需要更详细的信息,也可以添加更多类别,或删去一些不需要的类别。

博世宝马原型车展示了沃霍尔式的世界,为未来的机器人汽车奠定基础。从汽车制造向智能制造转型的过程中,它扮演着技术方案中不可分割的一部分。

入门自动驾驶Bosch语义分割计算机视觉产业
1