获得Open Images冠军,商汤TSD目标检测算法入选CVPR 2020

该论文名为《Revisiting the Sibling Head in Object Detector》,其提出基于任务间空间自适应解耦(task-aware spatial disentanglement,TSD)的检测算法能够有效的减弱通用物体检测中分类任务和回归任务之间的潜在冲突,可以灵活插入大多检测器中,在COCO和OpenImage上给任意backbone提升3~5%的mAP,该算法也作为核心解决方案(链接:https://arxiv.org/pdf/2003.07557.pdf)帮助港中文商汤联合实验室取得OpenImage Object Detection Challenge 2019 冠军。

Introduction

物体检测算法是许多计算机视觉任务中的重要手段,无论是在工业界还是学术界都是研究的重点。为了能够持续推动检测领域的算法创新,各种通用物体检测算法竞赛每年也会持续召开,如MSCOCO challenge以及OpenImage Object Detection Challenge。纵观历年来的冠军算法,Anchor-based的faster RCNN检测框架一直作为参赛选手的首选。受DoubleHead RCNN和IoUNet的启发,本文发现,在faster RCNN中,分类任务和回归任务对于输入特征不同位置的敏感性不同,如图1所示。

在实验中发现,分类任务更关注语义信息丰富的地方,而回归任务比较关注物体的边界处。在这样的一种潜在的性质下,传统的faster rcnn对于分类任务和回归任务共享同一个proposal和特征提取器(sibling head)就会出现一些内在的矛盾影响检测器的训练。本文基于此现象,提出了基于任务间空间自适应解耦(task-aware spatial disentanglement,TSD)的检测算法,对于分类任务和回归任务,分别让其学习各自适应的proposal和特征提取器。论文的主要贡献如下:

  • 提出了基于任务间空间自适应解耦(task-aware spatial disentanglement,TSD)的检测算法,对于分类任务和回归任务,分别让其学习各自适应的proposal和特征提取器。
  • 引入progressive constraint(PC)损失,来帮助检测器性能大幅度超越传统的检测器头部。
  • TSD帮助通用的检测器大幅度提升性能3%-5%,在COCO上,基于ResNet-101可以达到49.4的map,在SENet154上可以达到51.2。

Methods

检测流程定义:

TSD:

任务间空间自适应解耦学习:

Progressive constraintPC:

为了进一步提升任务间自适应空间解耦算法的训练,我们进一步提出渐进学术(PC),来使得TSD的检测器头部对于分类任务和定位任务的表现要优

Experiments

Ablation studies

1、从结构上进行任务间解耦

首先将TSD与在不同的level进行任务间解耦的结构进行比较,如图所示,

可以看到无论是从参数量上还是从性能上,TSD都有着明显的优势。

与sibling head联合训练

在TSD整体的训练中,传统的sibling head仍然可以进行联合训练来优化backbone,同时渐进约束损失(PC)可以进一步提升TSD的性能。

对于偏移量和的不同生成方式

对于偏移量的生成有两种方式,一种是对于proposal P中每一个grid都生成单独的偏移量(Point.w),一种是对于proposal P整体生成一个偏移量,即不同的grid之间共享(Prop.w)。具体的性能比较如下图:

渐进约束PC中margin的设置

可以看到,对于margin的选择,都可以稳定带来性能的提升,后续的实验统一采用margin为0.2。

TSD对于不同结构和不同任务的适应性

无论是在COCO的任务上还是更大规模的OpenImage数据集上,TSD都能够稳定的带来有效的收益,即便是在更大规模的backbone上,仍然提升比较稳定。即便是针对于分割任务,TSD对于检测任务的提升也能够进一步推动分割性能的增长。

与SOTA算法的比较

基于ResNet-101的backbone,TSD算法达到了新的state-of-the-art的性能,并且在SENet154-DCN的基础结构下,COCO的性能达到了51.2 map。

结论

本文针对通用物体检测算法中分类任务和定位任务之间因为优化目标不一致带来的潜在冲突,提出了基于任务间空间自适应解耦的检测算法TSD。在检测器头部通过特定设计的偏移量生成策略以及联合训练优化渐进损失来有效的提升检测器性能,在额外的计算损耗不超过10%的情况下,能够稳定的提升3%~5%的检测性能,并且成为OpenImage 2019 Object detection challenge夺冠的核心算法。大量实验证明,TSD可以比较容易的搭配各种不同的网络结构以及anchor-based的检测框架来进行使用。

理论Open Images目标检测CVPR 2020商汤科技
2
暂无评论
暂无评论~