ECCV 2020 Spotlight | 港中文、旷视科技等提出图像定位上的细粒化区域相似性自监督
本文介绍一篇发表于 ECCV 2020 的论文,该论文已被收录为 spotlight presentation。来自港中文、旷视科技和中国矿业大学的研究者针对大规模图像定位中的弱监督问题提出有效的解决方法,旨在通过自监督学习的方法充分挖掘表征学习中的难样本,并进一步将图像级监督细粒化为区域级监督,以更好地建模图像与区域间的复杂关系。利用该算法训练的模型具有较强的鲁棒性和泛化性,在多个图像定位数据集上进行了验证,Recall@1 准确度大幅超越最先进技术高达 5.7%,代码和模型均已公开。