Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

CVPR 2022放榜!2067篇论文被接收:提前传播真会被拒

你上榜了吗?


放榜了!

在短短几分钟,朋友圈已经被 CVPR 2022 论文接收结果公布的消息刷屏。


作为人工智能领域的顶级会议,CVPR 每年都会吸引大量研究机构和高校参会,投稿量在去年 11 月临近 deadline 时迅速超过了一万——上届 CVPR 2021 的有效投稿数还「仅有」7500 篇。创新高的投稿数引发了审稿压力,截止 1 月 25 日,共有 6427 位审稿人给出了 25801 个评审意见,包括 2104 位紧急审稿人的 3066 个紧急评审意见。

今天上午,CVPR 官方放出了今年大会接收的论文 ID。机器之心统计,有 2067 篇论文被接收。

论文接收 ID 列表:https://drive.google.com/file/d/15JFhfPboKdUcIH9LdbCMUFmGq_JhaxhC/view

在 meta review 之后,本届的最终论文接收结果将在一到两天后公布。

恭喜上榜的同学!

在欢呼并开始自我宣传的同时,也有人第一时间进行了本届接收论文的统计分析,看起来越早提交论文越好:


显然,越早提交的同学,通常研究完成度较高,没有赶 deadline 时的仓促。

今年的投稿也给人带来了一些经验教训。

早在去年 10 月,CVPR 官方就发布了重要通知:按照计划,从 2021 年 10 月 19 日到 2022 年 3 月 2 日为社交媒体静默期。在此期间,任何由作者主动发起的对论文的社交媒体宣传都被视为违反政策。


今天结果发下来,确实也有因为自行宣传投稿而被拒的情况出现。有论文作者在社交软件上表示,之前自己组里学生三个 weak accept 的工作 做了宣传页,并把 demo 上传了 YouTube,结果一封拒信发来:


这项规定的宗旨是解决同行评审过程中,因为作者机构被曝光后产生的偏见问题,虽然有人(比如 AI 先驱 Yann LeCun)表示反对,认为会影响前沿技术的传播速度,但目前看来 CVPR 会方执行得非常严格。

不过需注意,把论文发到预印版论文平台 arXiv 上,再用推特转发链接,或者是其他人在讨论,都是不违反规定的。

最大悬念:Masked Autoencoders 能否夺得最佳论文?

2021 年 11 月,何恺明时隔两年发布了一作论文《Masked Autoencoders Are Scalable Vision Learners》,当时上传到 arXiv 才不到半天,就登上了知乎热榜。

当时社交网络上就有一些讨论表示,这篇论文说不定能「预定」CVPR 2022 的最佳。一方面是因为 MAE 研究的确是按照 CVPR 格式上传的,同时也是因为 Masked Autoencoders 确实是一项很有质量的工作。这篇论文也是在太平洋时间 11 月 16 日的 CVPR 2022 论文提交截止时间之前上传的。 


论文链接:https://arxiv.org/abs/2111.06377

这篇论文展示了一种被称为掩蔽自编码器(masked autoencoders,MAE)的新方法,可以用作计算机视觉的可扩展自监督学习器。MAE 基于两个核心理念:研究人员开发了一个非对称编码器 - 解码器架构,其中一个编码器只对可见的 patch 子集进行操作(没有掩蔽 token),另一个简单解码器可以从潜在表征和掩蔽 token 重建原始图像。

研究人员进一步发现,掩蔽大部分输入图像(例如 75%)会产生重要且有意义的自监督任务。结合这两种设计,我们就能高效地训练大型模型:提升训练速度至 3 倍或更多,并提高准确性。

作者认为,这种可扩展方法允许学习泛化良好的高容量模型:例如在仅使用 ImageNet-1K 数据的方法中,vanilla ViT-Huge 模型实现了最佳准确率 (87.8%)。在下游任务中的传输性能优于有监督的预训练,并显示出可观的扩展能力。

Masked Autoencoders 提出了一种泛化性能良好的计算机视觉识别模型,有望为 CV 的大模型带来新方向,被寄予「获得最佳论文」的厚望也在情理之中。但获奖对于何恺明应该不是最重要的事,毕竟他已经多次获得 CVPR 奖项:包括 2009 年 CVPR 的 Best Paper,2016 年又获 Best Paper。

时隔六年,恺明大神会再度摘得最佳论文奖吗?一切都是悬念。
理论CVPR2022
相关数据
何恺明人物

Facebook AI Research研究科学家。Residual Net提出者。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

知乎机构

知乎,中文互联网综合性内容平台,自 2010 年成立以来,知乎凭借认真、专业、友善的社区氛围,独特的产品机制,以及结构化、易获得的优质内容,聚集了中文互联网科技、商业、影视、时尚、文化等领域最具创造力的人群,已成为综合性、全品类,在诸多领域具有关键影响力的内容平台。知乎将AI广泛应用与社区,构建了人、内容之间的多元连接,提升了社区的运转效率和用户体验。知乎通过内容生产、分发,社区治理等领域的AI应用,也创造了独有的技术优势和社区AI创新样本。

zhihu.com
机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
自监督学习技术

一个例子中的内容特别多,而用一个例子做一个任务,就等于把其他的内容浪费了,因此我们需要从一个样本中找出多个任务。比如说遮挡图片的一个特定部分,用没遮挡部分来猜遮挡的部分是一个任务。那么通过遮挡不同的部分,就可以用一个样本完成不同任务。Yann Lecun描述的这个方法被业界称作「自监督学习」

推荐文章
暂无评论
暂无评论~