Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

在线招聘AI或芯片人才、扩充数据标记团队,马斯克的「超级怪兽」1.0最快明年完成

Dojo神经网络训练计算机的目标是以更低的成本实现性能提升一个数量级。这也是掌握全球70多万台特斯拉汽车数据公司的必然选择。在马斯克的规划中,为处理海量视频数据而研发的Dojo超级计算机很可能会在一年后完成第一个版本。

撰文 | 吴昕、力琴

马斯克一直在死磕「全自动驾驶」。

「我觉得我们已经非常接近L5级自动驾驶了。我有信心,我们将在今年完成开发L5级别的基本功能。」在7月的世界人工智能大会上,马斯克曾高调表示。并随后在特斯拉第二季度财报上声明,公司正努力转向更复杂的人工智能框架,以提高 Autopilot功能。

言犹在耳,另一边,一辆特斯拉就在美国撞上了警车。不过,这并不妨碍马斯克为自己心爱的性能怪兽项目在线招新。

8月15日,马斯克发推特表示,特斯拉正在为名为「Dojo」的神经网络训练计算机项目「招兵买马」,招募AI或芯片人才。

目前,Tesla Autopilot 团队已经拥有超 300名有才能的工程师,其中软件工程师大约200名,芯片工程师100名。


众所周知,特斯拉一直使用摄像头来检测汽车和行人的存在,而不是激光雷达

目前,大约有75万辆特斯拉汽车在世界各地运行,这些车带有8个环绕摄像头。以用户平均每天可能会开车约一个小时计算,这支庞大的车队每月会产生约2000万小时的360度视频,每辆车8个摄像头,车队每月大约会产生1.7亿小时视频。让人工标注视频不仅困难,在经济上也不可行。因此,让数据学会自我监督将大大提升数据处理效率。这也是为什么马斯克对超级计算机寄予厚望的原因。

2019年11月,特斯拉的AI高级总监Andrej Karpathy 在一次演讲中透露,Dojo训练计算机的目标是以更低的成本将性能提升一个数量级。

目前,Dojo仍在建造中,从V1.0开始,可能大约一年后才会有结果。

这将是一台真正的超级计算机,马斯克在推特上表示。从技术上讲,还有很多工作要做,「我们已经以约0.01%的负载在 FPGA 上模拟过这台超级计算机的运行。」

根据马斯克本人在推特上的说法,将在「六到十周内以有限的公开发行形式」提供这项技术,这将成为特斯拉在自动驾驶系统里的一大进步。


马斯克解释Dojo为什么会是一头性能怪兽。


以约0.01%的负载在 FPGA 上模拟运行这个超级计算机。

在此之前,关于 「Dojo」 ,目前披露的消息并不多。马斯克提及这个项目主要集中在两次公开场合。

2019年8月4日,马斯克在推特上称,「Dojo将给自动驾驶技术带来不同。」在7日召开的特斯拉投资者日上,「Dojo」项目被曝光,马斯克称,该项目为标记视觉数据的关键。

特斯拉的车辆在行车过程中会生成大量的行驶视频,「Dojo」计算机的目标就是接收这些数据,并且在无人监督的时候,通过浏览大量视频文件识别此前系统未定义的讯息,例如坑洞、小狗等物体。

标记视觉数据难度很大,目前大多数系统采用的方法是根据图像帧判断,和Dojo计算机根据视频判断相比,高下立见——后者能结合场景,在更复杂的环境中更快地输出判断。

不难看出,Dojo是特斯拉继FSD芯片之后,在自动驾驶领域的又一大杀手锏。这意味着,如果这一效果未来能实现,特斯拉自动驾驶将会更自主。

马斯克在投资者日上表示,Dojo 是特斯拉目前最关注的项目之一,很有可能改变自动驾驶游戏规则。「客观说,这是世界上最好的技术」,并表示 2020 年,将有超过 100 万辆特斯拉汽车在路上使用全自动驾驶硬件,这意味着届时将有 100 万台 Robotaxi 的潜力。

2020 年7月的世界人工智能大会上,马斯克再次提到 Dojo 训练系统,目前遇到的瓶颈问题主要是芯片发热和运算速率,特斯拉也在开发新的总线和散热系统,辅助计算单元更高效地处理相应数据。

如进展顺利,「Dojo」可以改善Autopilot的工作方式——该系统正以「2.5D」运行,而马斯克打算升级,使其可以在「4D」环境下运行。

目前,Tesla Autopilot 已经拥有 300名有才能的工程师,外加500多位技艺高超的数据标记员。

「这是一项艰巨的工作,确实需要技能和培训,尤其是在4D(3D加上时间序列)标签时。」马斯克近期在接受外媒采访时曾透露,公司打算将数据标记员扩大到1000名。

走向全自动驾驶,而且坚持摄像头思路,听起来很简单,但实际上很困难并且需要人才。这也是马斯克推特公开招聘人才的重要原因。

尽管很少人会有信心预测robotaxis何时或者是否到来,但至少就特斯拉而言,它距离拥有未来驾驶辅助技术已经不远,而这足以让传统汽车制造商羡慕不已。

产业自动驾驶技术神经网络AI
相关数据
自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

激光雷达技术

自动驾驶车辆传感器的一种,采用激光扫描和测距来建立车辆周围环境的详细三维模型。Lidar 图像具有高度准确性,这使得它可以与摄像头、超声波探测器和雷达等常规传感器相提并论。然而激光传感器面临体积过大的问题,同时,它的机械结构非常复杂。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

推荐文章
暂无评论
暂无评论~