百度主办国际顶会CVPR 2020 LID研讨会,聚焦弱监督学习领域前沿

6月14-19日,计算机视觉领域世界三大顶会之一的CVPR 2020将在美国西雅图举办。近日,CVPR官网公布了本届大会主题研讨会的最终议程,由百度、悉尼科技大学、南开大学等单位共同主办的Learning from Imperfect Data(LID)研讨会将于6月14日召开,相关论文接收及3项顶尖赛事任务目前已正式开放报名,聚焦领域前沿的弱监督学习课题,与会者将进行深入交流与探讨。

作为国际计算机视觉模式识别领域的顶级学术会议,一年一度的CVPR 汇集了世界范围内的顶尖学者与企业。一直以来百度积极参与各届CVPR大会,屡屡取得瞩目成绩,如CVPR 2019中,百度共有17篇论文被收录,并接连获得 10 项 CVPR 竞赛任务的冠军,涵盖视觉领域下的视频理解与分析、图像超分辨、智能城市车辆识别等众多前沿方向。而本届大会中,由百度主办的Learning from Imperfect Data研讨会正是聚焦当前领域内热议的弱监督学习,这也是对百度视觉技术实力及前沿探索的极大认可。

监督学习,即通过较弱的监督信号来构建预测模型,已成为该领域内的热门课题。当前,随着大规模标注数据集的兴起和计算机硬件的进步,包括深度卷积神经网络在内的有监督学习方法为计算机视觉领域带来了显著突破。然而在实际工业应用中,无法获得足够数量的完美标注数据所带来的“数据饥渴”问题亟待解决。如何充分利用人工标注信息?如何减小标注工作量,将人类经验与学习规则充分结合?为解决这一问题,众多研究者在弱监督学习方法方面做了大量的努力,相关论文在CVPR、ICCV、ECCV、T-IP和T-PAMI等顶级会议和期刊上增长迅猛。

百度组织本次Learning from Imperfect Data研讨会,正是希望与顶尖业界和学术界研究者深入交流,共同探讨当前建立工业级人工智能系统的方法。

为进一步促进技术交流,从实践中验证成果,Learning from Imperfect Data挑战赛目前已正式开启。作为国际弱监督学习领域最权威的赛事,本届挑战赛分为弱监督语义分割、场景分析、目标定位三个赛道,提供了当前业内类别数目最多的弱监督数据集。比如语义分割任务中ILSVRC DET测试数据的pixel-level的mask,共包含了200类,是目前类别数最多的弱监督物体语义分割的数据集。目标定位任务提供了四万多张ILSVRC LOC-CLS测试数据的pixel-level mask,并提出了用IoU curve的方式来度量弱监督条件下生成的classi activation map的质量。

值得一提的是,今年组委会针对数据集和推理模型的参数量发布了两条规定。

1.参赛团队只允许使用数据集内的图像进行训练,不允许使用任何其他带有像素级标注的数据集。

2.推理模型的参数量不能超过150M。鼓励参赛团队设计一个高效的算法模型,避免简单进行多模型融合,最终榜单前三的参赛团队需要提交代码并由组委会审核。

除难度升级外,百度还将为每个赛道的优胜者提供现金奖励,提交基于百度深度学习平台飞桨的推理代码将获得额外的现金激励,鼓励选手在语义分割任务中使用飞桨PaddleSeg套件工具。飞桨以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台于一体,2016年正式开源,是中国全面开源开放、技术领先、功能完备的产业级深度学习平台。

期待本届赛事中涌现出更多优秀的方法,为机器视觉监督学习领域研究带来全新火花!

赛事报名地址:https://lidchallenge.github.io/challenge.html

产业LID监督学习CVPR 2020弱监督学习百度
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

监督学习技术

监督式学习(Supervised learning),是机器学习中的一个方法,可以由标记好的训练集中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练集是由一系列的训练范例组成,每个训练范例则由输入对象(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。

语义分割技术

语义分割,简单来说就是给定一张图片,对图片中的每一个像素点进行分类。图像语义分割是AI领域中一个重要的分支,是机器视觉技术中关于图像理解的重要一环。

百度机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

https://www.baidu.com/
目标定位技术

目标定位任务不仅要识别出图像中是什么,还要给出目标在图像中的位置信息。简单的说,就是用一个矩形框把识别的目标框出来(有时候也有多个固定数量的目标)。一般基本思路是多任务学习,网络带有两个输出分支。一个分支用于做图像分类,即全连接+softmax判断目标类别,和单纯图像分类区别在于这里还另外需要一个“背景”类。另一个分支用于判断目标位置,即完成回归任务输出四个数字标记包围盒位置(例如中心点横纵坐标和包围盒长宽),该分支输出结果只有在分类分支判断不为“背景”时才使用。

机器视觉技术

机器视觉(Machine Vision,MV)是一种为自动化检测、过程控制和机器人导航等应用提供基于图像的自动检测和分析的技术和方法,通常用于工业领域。

推荐文章
暂无评论
暂无评论~