6月14-19日,计算机视觉领域世界三大顶会之一的CVPR 2020将在美国西雅图举办。近日,CVPR官网公布了本届大会主题研讨会的最终议程,由百度、悉尼科技大学、南开大学等单位共同主办的Learning from Imperfect Data(LID)研讨会将于6月14日召开,相关论文接收及3项顶尖赛事任务目前已正式开放报名,聚焦领域前沿的弱监督学习课题,与会者将进行深入交流与探讨。
作为国际计算机视觉与模式识别领域的顶级学术会议,一年一度的CVPR 汇集了世界范围内的顶尖学者与企业。一直以来百度积极参与各届CVPR大会,屡屡取得瞩目成绩,如CVPR 2019中,百度共有17篇论文被收录,并接连获得 10 项 CVPR 竞赛任务的冠军,涵盖视觉领域下的视频理解与分析、图像超分辨、智能城市车辆识别等众多前沿方向。而本届大会中,由百度主办的Learning from Imperfect Data研讨会正是聚焦当前领域内热议的弱监督学习,这也是对百度视觉技术实力及前沿探索的极大认可。
弱监督学习,即通过较弱的监督信号来构建预测模型,已成为该领域内的热门课题。当前,随着大规模标注数据集的兴起和计算机硬件的进步,包括深度卷积神经网络在内的有监督学习方法为计算机视觉领域带来了显著突破。然而在实际工业应用中,无法获得足够数量的完美标注数据所带来的“数据饥渴”问题亟待解决。如何充分利用人工标注信息?如何减小标注工作量,将人类经验与学习规则充分结合?为解决这一问题,众多研究者在弱监督学习方法方面做了大量的努力,相关论文在CVPR、ICCV、ECCV、T-IP和T-PAMI等顶级会议和期刊上增长迅猛。
百度组织本次Learning from Imperfect Data研讨会,正是希望与顶尖业界和学术界研究者深入交流,共同探讨当前建立工业级人工智能系统的方法。
为进一步促进技术交流,从实践中验证成果,Learning from Imperfect Data挑战赛目前已正式开启。作为国际弱监督学习领域最权威的赛事,本届挑战赛分为弱监督语义分割、场景分析、目标定位三个赛道,提供了当前业内类别数目最多的弱监督数据集。比如语义分割任务中ILSVRC DET测试数据的pixel-level的mask,共包含了200类,是目前类别数最多的弱监督物体语义分割的数据集。目标定位任务提供了四万多张ILSVRC LOC-CLS测试数据的pixel-level mask,并提出了用IoU curve的方式来度量弱监督条件下生成的classi activation map的质量。
值得一提的是,今年组委会针对数据集和推理模型的参数量发布了两条规定。
1.参赛团队只允许使用数据集内的图像进行训练,不允许使用任何其他带有像素级标注的数据集。
2.推理模型的参数量不能超过150M。鼓励参赛团队设计一个高效的算法模型,避免简单进行多模型融合,最终榜单前三的参赛团队需要提交代码并由组委会审核。
除难度升级外,百度还将为每个赛道的优胜者提供现金奖励,提交基于百度深度学习平台飞桨的推理代码将获得额外的现金激励,鼓励选手在语义分割任务中使用飞桨PaddleSeg套件工具。飞桨以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台于一体,2016年正式开源,是中国全面开源开放、技术领先、功能完备的产业级深度学习平台。
期待本届赛事中涌现出更多优秀的方法,为机器视觉弱监督学习领域研究带来全新火花!