滴滴携手BDD启动CVPR 2019 WAD挑战赛,邀全球高手解决自动驾驶领域重点难题

3月28日,滴滴联合加州大学伯克利分校DeepDrive深度学习自动驾驶产业联盟(BDD)正式启动CVPR 2019 WAD自动驾驶识别挑战赛,邀请全球算法高手来挑战自动驾驶领域重点难题。

CVPR(Conference on Computer Vision and Pattern Recognition)是全球计算机视觉模式识别顶级会议,今年将于6月16日-20日在美国长滩举行。CVPR WAD挑战赛(Workshop on Autonomous Driving)则是国际上以自动驾驶视觉为核心的顶级评测大赛,以数据规模大、难度高著称,每年CVPR WAD挑战赛都能吸引全球业界和学术界的多路顶级团队参与。

本次CVPR 2019 WAD挑战赛共提供了四项全新的基于多个驾驶数据集的自动驾驶相关任务。其中,滴滴共参与提出目标检测迁移学习、目标跟踪迁移学习、大规模检测插值三项任务,并提供一个大规模、高质量的真实驾驶场景视频数据集D²-City(https://gaia.didichuxing.com/d2city),涵盖12类行车和道路相关的目标标注,旨在鼓励相关领域前沿算法的发明与实现。

两项迁移学习挑战赛均建立在滴滴此次发布的D²-City数据集与BDD发布的BDD100K数据集上。目标检测迁移学习挑战赛中,参赛者需要利用采集自美国的BDD100K数据,训练目标检测模型用于采集自中国的D²-City数据;目标跟踪迁移学习挑战赛中,参赛者需要利用D²-City数据训练模型应用于BDD100K数据。

而在大规模检测插值探索赛中,参赛者需要基于D²-City数据集,在大量只提供了关键帧标注的视频上补全整段视频的框检测结果。这项探索赛致力于鼓励在目标检测插值、检测追踪、域适应等各领域结合的应用的相关研究。参赛者可以利用BDD100K数据集和其他公开可用的相关数据集或是借助部分人工标注修正去提升最终结果。

与现有的自动驾驶公开数据集相比,此次发布的D²-City数据集提供了更多在复杂或有挑战性的天气、交通、采集状况下所收集的真实场景数据,如光线不足、雨雾天气、道路拥堵、图像清晰度低等,涵盖了中国不同城市的驾驶场景。同时,D²-City数据集也计划提供大规模的精准标注信息,包括在数千段视频、数十万关键帧上的目标检测标注及在近千段视频上的目标跟踪标注。

即日起,全球企业、研究机构和院校均可组成参赛队伍在挑战赛官网(http://wad.vision)进行报名,挑战赛将于 2019 年 5 月31日截止,而最终优胜团队奖项将在 6月17 日的 CVPR 2019自动驾驶研讨会上正式颁发。

滴滴方面表示,滴滴希望建设高效、开放可持续的未来出行新生态,携手BDD举办CVPR 2019 WAD挑战赛,也是希望能鼓励研究者设计利用迁移学习运用已有的领域知识帮助求解不同但相关领域的类似问题,有效推进自动驾驶相关视觉算法在不同环境和条件下的实用落地;同时促进相关研究者和从业人士通过算法性能改进、合理使用人力等手段,进一步提升标注速度和质量、降低标注成本,“欢迎全球算法高手加入其中,共同激励更多科技创新。”

产业CVPR自动驾驶深度学习加州大学伯克利分校滴滴
4
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

插值技术

数学的数值分析领域中,内插或称插值(英语:interpolation)是一种通过已知的、离散的数据点,在范围内推求新数据点的过程或方法。求解科学和工程的问题时,通常有许多数据点借由采样、实验等方法获得,这些数据可能代表了有限个数值函数,其中自变量的值。而根据这些数据,我们往往希望得到一个连续的函数(也就是曲线);或者更密集的离散方程与已知数据互相吻合,这个过程叫做拟合。

迁移学习技术

迁移学习是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。 迁移学习对人类来说很常见,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。

加州大学伯克利分校机构

加利福尼亚大学伯克利分校,简称加州大学伯克利分校,又常被译为加利福尼亚大学伯克莱分校,位于美国加利福尼亚州旧金山湾区伯克利市,是一所世界著名的公立研究型大学。其许多科系位于全球大学排行前十名,是世界上最负盛名的大学之一,常被誉为美国乃至世界最顶尖的公立大学。

https://www.berkeley.edu/
目标检测技术

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。

推荐文章
暂无评论
暂无评论~