Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

旷视、北邮等国内团队包揽六项第一,COCO&Mapillary 联合挑战赛结果公布

当地时间 9 月 8 日,两年一度的欧洲计算机视觉顶级学术会议 ECCV 2018 在德国慕尼黑拉开帷幕。作为计算机视觉领域的三大顶会之一,ECCV 2018 受到了极大的关注,火热异常。如今大会官网还挂着一份醒目的通知:大会已满额,没地方了。

据数据显示,本届大会注册参会人数近 3200 人,收到论文投稿 2439 篇,其中接收 776 篇(31.8%)。在活动方面,ECCV 2018 共有 43 场 Workshops 和 11 场 Tutorials。

 今日,在大会研讨会 Joint COCO and Mapilary Recognition Challenge Workshop 上,会议组织方公布了备受关注的 COCO + Mapillary 联合挑战赛的结果,来自中国的创业公司、高校团队包揽了 6 个项赛的第一名。

挑战赛简介

计算机视觉领域有众多挑战赛,MS COCO 是其中最受关注和最权威的比赛之一。COCO 是英文 Commen Objects in Context 的缩写,并有同名论文发布。COCO 数据集针对全场景理解而设计,意在促进物体检测研究发展。

Mapillary Vistas 是新近推出的街景集图像数据集,专注于图像的高阶语义理解,推动自动驾驶和机器人导航等领域的技术落地。在数据集和应用任务方面,两者有很多不同,而后者对前者起补足作用。通常来讲,COCO 是自然场景下的物体识别,Mapillary 则聚焦于街景场景识别,因此联合挑战赛的形式有利于计算机视觉技术更贴近现实场景,更具应用价值。

本届在 ECCV 2018 上的 COCO + Mapillary 联合挑战赛,包含 4 项 COCO 比赛、2 项 Mapillary 比赛,共计 6 个赛项。

其中 COCO 挑战赛项有 :

  • Instance Segmentation(实例分割)

  • Panotic Segmentation(全景分割)

  • Keypoints(人体关键点检测)

  • DensePose(人体密集姿态估计)

Mapillary 挑战赛项包括:

  • Vistas Instance Segmentation(路景实例分割)

  • Vistas Panotic Segmentation(路景全景分割)

值得一提的是,自 2015 年首届挑战赛以来,COCO 赛项数量不断更新,评估标准也更加复杂。COCO 2018 相较往年又有改变。在检测方面,实例分割近年在 COCO 上大为流行,今年,COCO 和 Mapillary 都有此赛项;随着检测技术走向饱和,COCO 去掉了边界框检测这一赛项,但成绩依然出现在榜单上。另外一个变动是新增了 DensePose 和 Panoptic Segmentation 两个赛项。Panoptic Segmentation 同时解决一张图像上前景物体与背景物体的分类问题,把互为分裂的语义分割和实例分割整合为一,推动分割技术步入新境界,不断逼近现实应用。COCO 和 Mapillary 也都有此赛项。

大赛结果出炉

今日,在 Joint COCO and Mapilary Recognition Challenge Workshop(COCO & Mapillary 物体识别联合挑战赛研讨会)上,主办方最终公布了比赛结果。

从 COCO 数据集 Detection Leaderboard 上我们可以看到,港中文 - 商汤联合实验室 MMDet 团队、旷视科技团队在 COCO 实例分割赛项上比分接近(上图中旷视科技团队与 MMDet 团队同为 Winner),MMDet 团队平均得分比旷视科技高了 0.1%。

虽然其他 COCO 赛项得分还未显示在 Leaderboard 上,但我们可以从 COCO + Mapillary 联合挑战赛官网公布的 Workshop 日程上看出:

  • COCO 关键点检测赛项:旷视科技第一,MSRA 团队第二;

  • COCO 全景分割赛项:旷视科技第一,Caribbean 与 PKU_360 团队第二;

  • COCO 姿态估计赛项:北京邮电大学模式识别与智能视觉实验室团队第一名;

因 Mapillary 竞赛组织方选择对以下两个比赛的结果保密,因此具体得分信息我们看不到。

但从 Workshopri 日程表中可以看出滴滴地图计算部团队获得 Mapillary 实例分割赛项第一名;旷视科技获得 Mapillary 全景分割赛项第一,TRI-ML 团队第二。

产业ECCV 2018旷视科技挑战赛
1
相关数据
自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

分类问题技术

分类问题是数据挖掘处理的一个重要组成部分,在机器学习领域,分类问题通常被认为属于监督式学习(supervised learning),也就是说,分类问题的目标是根据已知样本的某些特征,判断一个新的样本属于哪种已知的样本类。根据类别的数量还可以进一步将分类问题划分为二元分类(binary classification)和多元分类(multiclass classification)。

物体识别技术

计算机视觉领域的一个分支,研究物体的识别任务

推荐文章
暂无评论
暂无评论~