2016年欧洲计算机视觉大会纪要 ECCV'16 Recap

计算机视觉(Computer Vision, CV)是人工智能领域的一个重要研究子领域。随着近年来 CV 学界研究成果在业界产生的巨大产业影响,计算机视觉受到越来越多的关注。机器之心曾整理报道过ECCV‘2016的各项最佳论文奖。本文为机器之心专栏作者魏秀参记录下的大会纪要。


同计算机其他研究领域一样,CV 依然有着较浓厚的「会议情节」,其中每年一届的 Computer Vision and Pattern Recognition (CVPR)、两年一届的 International Conference on Computer Vision (ICCV) 和同样两年一届的 European Conference on Computer Vision (ECCV) 并称 CV 领域的三大顶会,其中 ICCV 和 ECCV 奇偶年交替召开。


笔者有幸参加了 2016 年欧洲计算机视觉大会(ECCV 2016),在此将大会纪要同大家分享。


Synced (32).JPG


本次 ECCV 在素有「北方威尼斯」之称的荷兰迷幻浪漫都市阿姆斯特丹举办,会议历时九天(10 月 8 日至 10 月 16 日),可谓「饕餮盛宴」,其中主会从 11 日到 14 日持续四天,其余时间为 workshop 日程。值得一提的是,多媒体领域顶会 ACM Multimedia(ACM MM)于 15 日至 19 日接续 ECCV,同样在阿姆斯特丹举办,真是让人过足了 AI 瘾。此外,城市中不时弥漫开来的大麻气味无疑给这两大会徒添了一种别样的神秘气息。


ECCV 主会

blob.png


本次 ECCV 主会在始建于 1887 年的皇家剧场 Carré举行,注册参会人数约 1700 人。有效投稿数为 1561 篇,共 74 位 Area Chairs 和 1163 位审稿人(Reviewers),录用论文 415 篇,录用比例 26.6%,其中 28 篇为 Oral(占 1.8%),45 篇为 Spotlight(2.9%)。收录论文的主题仍然延续传统,覆盖了计算机视觉和模式识别的各个方向,包括:


  • 3D computer vision

  • Computational photography, sensing and display

  • Face and gesture

  • Low-level vision and image processing

  • Motion and tracking

  • Optimization methods

  • Physics-based vision, photometry and shape-from-X

  • Recognition: detection, categorization, indexing, matching

  • Segmentation, grouping and shape representation

  • Statistical methods and learning

  • Video: events, activities and surveillance

  • Applications


其中,深度学习(DL)、3D、视频相关等为热门方向。而审稿人方面,也是 DL、3D 等方向审稿人居多,特别是深度学习,异军突起。(PS:但是审稿人多并不一定是好事。由于不同研究背景的研究人员都进入 DL 领域,导致 DL 审稿人给出的审稿意见参差不齐,不同意见间的「方差」很大。)相比之下,审稿人最少的 Sensors 领域人数只是 DL 的七分之一。


blob.png

blob.png

主会日程基本半天一个单元,每个单元中前场分别是 Oral 和 Spotlight 报告,接下来则是 Poster 环节。有关 Oral、Spotlight 和 Poster paper 具体内容可参见 ECCV 2016 主页。


ECCV Workshops


本次依托 ECCV 举办的 workshop 共有 26 个,一些在当地酒店举办,一些在阿姆斯特丹大学举办。Workshop 中比较吸引人眼球的还属「Joint ImageNet and MS COCO Visual Recognition Challenge」了。这次 ImageNet 竞赛比较显著的一个特征即今年的获胜者基本是华人团队,如商汤(SenseTime)、海康威视(HIK Vision)、360 AI,公安部三所等。另外,比赛结果中并未见 Google、微软、百度等公司的身影。在此也祝贺在各项比赛细类中取得名次的队伍!


另外,笔者也有幸作为 team director 参加了 Apparent Personality Analysis 竞赛,历时两个多月,我们的参赛队(NJU-LAMDA)在 86 个参赛者,其中包括有印度「科学皇冠上的瑰宝」之称的 Indian Institutes of Technology(IIT)和荷兰名校 Radboud University 等劲旅中脱引而出,斩获第一。关于竞赛细节,可参看近期我们发布在「深度学习大讲堂」的竞赛经验分享。


晚宴和颁奖


由于阿姆斯特丹是运河城市且沿海,ECCV 晚宴特地选定在「Ocean Diva 号」游轮上举行。各国人工智能研究者济济一堂,好不热闹!只是「晚宴」并不如我们想象中的中式会议晚宴那么丰富甚至奢华,国外会议晚宴一般都是以啤酒、饮料穿插以小吃、汉堡为主。


download.jpg


晚宴的重要时刻即大会颁奖,本次的最佳论文及提名,和最佳学生论文均授予了传统计算机视觉研究问题,而非深度学习。一则可以看出深度学习相关研究目前难度日益加大,欲做出有突破性进展的工作不易;二则可以看出 CV 大佬有意扶持传统研究问题,维护 CV 生态平衡,不致 DL 一家独大。


Synced (32).JPG


另外,Koenderink Prize(ECCV「十年最佳论文」)授予了著名的 SURF: Speeded up robust features (ECCV 2006) (Herbert Bay, Tinne Tuytelaars and Luc Van Gool) 和 Machine learning for high-speed corner detection (ECCV 2006) (Edward Rosten and Tom Drummond)。值得一提的是,在宣布 SURF 获奖之际当即引来一片欢呼,可见其工作深入人心之甚。PAMI Everingham Prize(CV 领域的最佳贡献奖)分别授予了 ImageNet 数据集团队和 Ramin Zabih 以表彰其在开源数据集,和服务 Computer Vision Foundation 上的卓越贡献。


干货时间


开会数日,笔者有心记录了一些会议观察,在此与君共享。不过受个人研究兴趣影响,以上内容不免有所偏颇,望诸君选择性参考。


  1. 这次会上大佬们如 Jitendra, Cordelia 在力推 self-supervised learning(基于 robot 反馈机制,例如,机械手臂戳一下物体,从 sensor 或视频中获得反馈,可以看作是用 robot 来探知世界吧),最近 arxiv 也有一篇类似的 https://arxiv.org/abs/1605.07157;另外,很多利用 side information,如利用声音辅助视觉,这样的工作在本次 ECCV 上也屡见不鲜;

  2. 冠名弱监督学习(Weakly supervised learning)的工作非常多了,但是「弱监督」的内涵却是个圆其说,不像机器学习中有明确的定义;因此,以后基于弱监督设定的计算机视觉问题还应该有做的空间;

  3. 底层视觉(Low-level vision)问题/任务极少,几乎没有,不像 ICCV 2015 还有若干篇的样子;而且一些工作开始用 DL 去做 low-level vision 的东西,比如 Ming-Hsuan Yang 在这次会上的两篇利用 DL 技术学习底层视觉中的滤波器(Filters)。(http://faculty.ucmerced.edu/mhyang/papers/eccv16_joint_filter.pdf http://faculty.ucmerced.edu/mhyang/papers/eccv16_rnn_filter.pdf

  4. 传统细粒度图像相关工作几乎没有,只有一篇做细粒度图像任务的新问题,即细粒度场景图像分类(Fine-grained scene classification)(https://arxiv.org/abs/1607.07614);

  5. 有两篇 image colorization 作为 oral paper,不知是否是巧合;

  6. Question answering 这类问题相比 ICCV 少了很多,但隐式做 visual-text 的工作还是占了一定比例;

  7. 下面几篇文章做的问题比较有趣:

a) Amodal instance segmentation, Ke Li and Jitendra Malik.(构造新数据集,做了新问题)

b) Automatic Attribute Discovery with Neural Activations, Sirion Vittayakorn, University of North Carolina at Chapel Hill; Takayuki Umeda, NTT; Kazuhiko Murasaki, NTT; Kyoko Sudo, NTT; Takayuki Okatani, Tohoku University; Kota Yamaguchi, Tohoku University

c) Pixel-Level Domain Transfer, Donggeun Yoo, KAIST; Namil Kim, KAIST; Sunggyun Park, KAIST; Anthony Paek, Lunit Inc.; In So Kweon, KAIST (根据衣服生成买家秀,或反过来,在真实场景下,从模特照片中生成产品照片)


最后,总结来说,这次参会最明显也是最微妙的一个感受就是,多数工作在开会前都没有看过。而不像前两年参加顶会时发现绝大多数文章已经是 arxiv 上读过很久的工作,甚至已经跑过源码,去开会也只是和作者当面聊聊天,甚至当时还有一种顶会更新速度落后于 arxiv 的感受。ECCV'16 这一现象恰恰说明深度学习研究的发展慢慢从当初的白炽化走向正常化,从着急忙慌的在 arxiv 上占坑走向踏踏实实的顶会发表。另外也从侧面显示了深度学习研究难度的提升,就拿 arxiv 举例,一年前几乎每天都能看到有令人 exciting 的文章更新出来,而近期不仅发布文章的数量有所下降,重要的是有趣的文章更是难得一见。这次会上也与众多老友把酒言欢,同时也认识了很多新朋友,期待下次的 CV 大趴,我们 CVPR'17 再见。


10 月 30 日于澳大利亚阿德莱德

(题图为笔者摄于 Zaandam 风车村)

作者简介:

魏秀参:南京大学计算机系机器学习与数据挖掘所(LAMDA)博士生,研究方向为计算机视觉和机器学习。曾在国际顶级期刊和会议发表多篇学术论文,并多次获得国际计算机视觉相关竞赛冠亚军,另撰写的「Must Know Tips/Tricks in Deep Neural Networks」受邀发布于国际知名数据挖掘论坛 KDnuggets 等. 微博 ID:Wilson_NJUer

入门计算机视觉会议ECCV 16产业
暂无评论
暂无评论~