Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

杜伟、陈萍编辑

ECCV 2022全奖项公布,两位华人学者摘得最佳论文奖,本科来自清华、浙大

近日,位列计算机视觉领域三大国际顶级会议的 ECCV 2022 在以色列特拉维夫开幕,大会以线上、线下方式相结合。本届会议的各奖项已经揭晓。

据大会官方统计,今年共有 18310 位作者提交了 6773 篇论文,总共有 5804 份有效投稿,最终 1645 篇论文被接收,其中包括 157 篇 Oral,整体接收率为 28%,与上届持平。

国内科研机构和企业在 ECCV 2022 上斩获颇丰,以商汤为例,入围论文共 70 篇,包含 6 篇 Oral、64 篇 Poster。同时,商汤还主办了两个 Workshop 及相关竞赛,均在 ECCV 期间举行并发布结果。

昨晚,大会公布了一系列奖项,威斯康星大学麦迪逊分校、Butlr 的研究者摘得最佳论文奖,还有 2 篇论文获得了最佳论文荣誉提名奖。与往届一样,大会还公布了经典论文 Koenderink 奖和 PAMI Everingham 奖。


最佳论文奖

本届最佳论文由来自威斯康星大学麦迪逊分校、Butlr 的研究者摘得。

图源:Twitter@CSProfKGD

  • 论文地址:https://arxiv.org/pdf/2207.09684.pdf

  • 代码地址:https://github.com/zhenxingjian/Partial_Distance_Correlation

这篇论文由四位研究者共同完成,他们分别是 Xingjian Zhen 、Zihang Meng 、 Rudrasis Chakraborty 以及 Vikas Singh ,其中两位是华人作者。

Xingjian Zhen 为威斯康星大学麦迪逊分校计算机科学博士生。在此之前,他于 2017 年获得清华大学电子工程系的学士学位。其研究兴趣是计算机视觉深度学习,微分几何,统计学和医学成像。此外,他还在 NeurIPS、ICCV、CVPR、 AAAI 等发表过多篇文章。

个人主页:https://zhenxingjian.github.io/homepage/

Zihang Meng 为 Meta AI(原 Facebook AI)研究科学家。在此之前,他在威斯康星大学麦迪逊分校获得计算机科学博士学位,师从 Vikas Singh 教授。他于 2017 年获得浙江大学电子信息工程学士学位。目前的研究方向是机器学习及其在计算机视觉中的应用。

个人主页:https://pages.cs.wisc.edu/~zihangm/

Rudrasis Chakraborty 为 Butlr 软件公司的高级机器学习科学家,主要从事统计学、微分几何和深度学习的交叉研究。

Vikas Singh 为 Zihang Meng 的博士生导师。Singh 为威斯康星大学麦迪逊分校生物统计系的教授,主要研究方向是图像分析,包括计算机视觉机器学习和医学图像分析。

摘要:比较神经网络模型的功能行为,无论是在训练期间的单个网络,还是训练一段时间后的两个网络(或更多网络),这些是了解模型正在学习什么(以及它们没有学习什么)的重要步骤,同时也是确定规范化或提高效率的重要策略。

最近的研究已经取得了一些进展,例如研究者将视觉 transformers 与 CNN 进行比较,但系统地比较功能,特别是在不同的网络之间,仍然存在很多困难,通常的做法是一层一层地进行比较。

CCA(canonical correlation analysis)等方法在原则上适用,但迄今为止用的人很少。本文回顾了统计学中一个鲜为人知的概念,称为距离相关(及其部分变体),它被设计用来评估不同维度特征空间之间的相关性。该研究描述了将其部署到大规模模型的必要步骤,这为一系列应用打开了大门,包括调节一个深度模型,学习解耦表示,以及优化不同的模型,这些模型在应对对抗攻击时,鲁棒性更好。


最佳论文荣誉提名奖

与此同时,ECCV 2022 也公布了最佳论文荣誉提名奖,共有 2 篇论文获奖。

论文 1:Pose-NDF: Modelling Human Pose Manifolds with Neural Distance Fields

图源:Twitter@CSProfKGD

  • 论文地址:https://virtualhumans.mpi-inf.mpg.de/posendf/

  • 机构:图宾根大学、马克斯 · 普朗克研究所、Meta Reality Labs

摘要:本文提出了一种基于神经距离场 (NDFs) 的人体姿态连续模型:Pose-NDF。众所周知,姿态或动作先验对于生成逼真的新姿态非常重要,对从有噪声或局部观察重建精确的姿态也非常重要。Pose-NDF 学习一系列各种可能的姿态作为神经隐式函数的零水平集(zero level set),将 3D 建模隐式曲面的思想扩展到高维域 SO(3)^K,其中人体姿态由单个数据点定义,由 K 个四元数表示。由此得到的高维隐函数可以对输入姿态进行微分,因此可以通过在 3 维超球体集合上使用梯度下降将任意姿态投射到流形(manifold)上。

与之前基于 VAE 的人体姿态先验(将姿态空间转换为高斯分布)相比,该研究对真实姿态流形进行建模,以保留姿态之间的距离。该研究证明 PoseNDF 在各种下游任务中优于 SOTA 方法,包括从对真实世界的人体动作捕捉数据进行去噪、从遮挡数据中恢复姿态到从图像中重建 3D 姿态。此外,该研究表明,与基于 VAE 的方法相比,Pose-NDF 可生成更多样化的姿态。

论文 2:A Level Set Theory for Neural Implicit Evolution under Explicit Flows

图源:Twitter@CSProfKGD

  • 论文地址:https://arxiv.org/pdf/2204.07159.pdf

  • 机构:加州大学圣地亚哥分校

摘要:基于坐标的神经网络参数化隐式表面已经成为几何的有效表示,它们高效充当了参数水平集,其中零水平集定义了感兴趣的表面。研究者提出了一个框架,允许将为三角形网格定义的变形操作应用于这类表面。这些操作中的一些可以被视为在显式表面引起瞬时流场的能量最小化问题。他们的方法通过扩展水平集的经典理论,利用流场来实现参数化隐式表面变形。

此外,通过形式化与水平集理论的关联,研究者还为现有的可微表面提取和渲染方法得出一个统一的观点。他们认为这些方法偏离了理论,并展示了自身方法对表面平滑、平均曲率流、逆渲染和用户定义的隐式几何编辑等应用的改进。


经典论文:Koenderink 奖

Koenderink 奖旨在表彰计算机视觉领域的基础性贡献研究,获奖论文均为发表时间超过十年并经受住时间检验的研究。

本届的获奖论文是《Indoor Segmentation and Support Inference from RGBD Images》,于 2012 年发表,被引数超过了 4500。当时几位作者分别来自纽约大学、伊利诺伊大学厄巴纳 - 香槟分校和微软剑桥研究院。

该论文的获奖理由是「激励广泛的社区投入研究工作,为一个至今仍具有挑战性的计算机视觉问题开发出了新颖的解决方案。」

图源 Twitter@CSProfKGD

摘要:研究者提出了一种从 RGBD 图像中解释室内场景主要表面、对象和支撑关系的方法,将典型、通常杂乱无章的室内场景解析为地板、墙壁、支撑表面和对象区域。他们的主要兴趣之一是更好地了解 3D 提示如何以最佳方式为结构化 3D 解释提供信息。

此外,研究者创建了一个新颖的整数规划公式来推断物理支撑关系,提供了一个包含 1449 张 RGBD 图像的新数据集,捕获了 464 个具有详细注释的不同场景。实验证明了他们所提方法在复杂场景中推断支撑关系的能力,并验证了 3D 场景提示和推断支持能够实现更好的对象分割效果。

论文地址:https://cs.nyu.edu/~silberman/papers/indoor_seg_support.pdf


PAMI Everingham 奖

该奖项旨在纪念 Mark Everingham,鼓励其他人向他学习,推进整个计算机视觉社区进一步发展。PAMI Everingham 奖授予对计算机视觉社区做出无私贡献的研究者或研究团队,由 IEEE 计算机协会模式分析与机器智能(PAMI)技术委员会颁发。

本届获奖者是圣母大学计算机科学与工程副教授 Walter J. Scheirer,以表彰其对计算机视觉社区的长期杰出服务和奉献。

图源:Twitter@CSProfKGD

Walter J. Scheirer 的研究兴趣主要围绕识别问题展开,包括识别问题解决方案的表示和算法。他还对适用于视觉与语言的特征和基于学习的方法特别感兴趣,摆脱了识别任务长期以来的分割。这衍生出了一些有趣且非常规的方法,它们可以应用于 CV、ML 和人类生物识别等更广泛的 AI 领域。目前,他的工作专注于开集识别、视觉识别的极值理论模型以及受生物启发的学习算法。

Walter J. Scheirer

此外,大会还公布了 2021 和 2022 年度 ECVA 年轻研究者奖,分别由图宾根大学计算机科学教授 Zeynep Akata 和洛桑联邦理工学院计算机科学助理教授 Amir Zamir 摘得。

理论计算机视觉ECCV 2022
相关数据
清华大学机构

清华大学(Tsinghua University),简称“清华”,由中华人民共和国教育部直属,中央直管副部级建制,位列“211工程”、“985工程”、“世界一流大学和一流学科”,入选“基础学科拔尖学生培养试验计划”、“高等学校创新能力提升计划”、“高等学校学科创新引智计划”,为九校联盟、中国大学校长联谊会、东亚研究型大学协会、亚洲大学联盟、环太平洋大学联盟、清华—剑桥—MIT低碳大学联盟成员,被誉为“红色工程师的摇篮”。 清华大学的前身清华学堂始建于1911年,因水木清华而得名,是清政府设立的留美预备学校,其建校的资金源于1908年美国退还的部分庚子赔款。1912年更名为清华学校。1928年更名为国立清华大学。1937年抗日战争全面爆发后南迁长沙,与北京大学、南开大学组建国立长沙临时大学,1938年迁至昆明改名为国立西南联合大学。1946年迁回清华园。1949年中华人民共和国成立,清华大学进入了新的发展阶段。1952年全国高等学校院系调整后成为多科性工业大学。1978年以来逐步恢复和发展为综合性的研究型大学。

http://www.tsinghua.edu.cn/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

高斯分布技术

正态分布是一个非常常见的连续概率分布。由于中心极限定理(Central Limit Theorem)的广泛应用,正态分布在统计学上非常重要。中心极限定理表明,由一组独立同分布,并且具有有限的数学期望和方差的随机变量X1,X2,X3,...Xn构成的平均随机变量Y近似的服从正态分布当n趋近于无穷。另外众多物理计量是由许多独立随机过程的和构成,因而往往也具有正态分布。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

梯度下降技术

梯度下降是用于查找函数最小值的一阶迭代优化算法。 要使用梯度下降找到函数的局部最小值,可以采用与当前点的函数梯度(或近似梯度)的负值成比例的步骤。 如果采取的步骤与梯度的正值成比例,则接近该函数的局部最大值,被称为梯度上升。

规范化技术

规范化:将属性数据按比例缩放,使之落入一个小的特定区间,如-1.0 到1.0 或0.0 到1.0。 通过将属性数据按比例缩放,使之落入一个小的特定区间,如0.0到1.0,对属性规范化。对于距离度量分类算法,如涉及神经网络或诸如最临近分类和聚类的分类算法,规范化特别有用。如果使用神经网络后向传播算法进行分类挖掘,对于训练样本属性输入值规范化将有助于加快学习阶段的速度。对于基于距离的方法,规范化可以帮助防止具有较大初始值域的属性与具有较小初始值域的属相相比,权重过大。有许多数据规范化的方法,包括最小-最大规范化、z-score规范化和按小数定标规范化。

暂无评论
暂无评论~