Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

王延峰、张娅专栏

ECCV 2022 Oral | 无需微调即可推广,上交大、上海人工智能实验室等提出基于配准的少样本异常检测框架

尝试探索这种设置是异常检测走向实际大规模工业应用的重要一步。

近年来,异常检测在工业缺陷检测、医疗诊断,自动驾驶等领域有着广泛的应用。“异常”通常定义为 “正常” 的对立面,即所有不符合正常规范的样本。通常来说,相比于正常,异常事件的种类是不可穷尽的,且十分稀有,难以收集,因此不可能收集详尽的异常样本进行训练。因此,近期关于异常检测的研究主要致力于无监督学习,即仅使用正常样本,通过使用单类别(one-class)分类,图像重建(reconstruction),或其他自监督学习任务对正常样本进行建模,之后,通过识别不同于模型分布的样本来检测异常。

大多数现有的异常检测方法都专注于为每个异常检测任务训练一个专用模型。然而,在诸如缺陷检测之类的真实场景中,考虑到要处理数百种工业产品,为每种产品均收集大量训练集是不划算的。对此,上海交通大学 MediaBrain 团队和上海人工智能实验室智慧医疗团队等提出了一个基于配准的少样本异常检测框架,通过学习多个异常检测任务之间共享的通用模型,无需进行模型参数调整,便可将其推广到新的异常检测任务。目前,这项研究已被 ECCV2022 接收为 Oral 论文,完整训练代码及模型已经开源。

图片

  • 论文链接:https://arxiv.org/abs/2207.07361
  • 代码链接:https://github.com/MediaBrain-SJTU/RegAD

方法简介


在这项工作中,少样本异常检测通用模型的训练受到了人类如何检测异常的启发。事实上,当尝试检测图像中的异常时,人们通常会将该检测样本与某个已经被确定为正常的样本进行比较,从而找出差异,有差异的部分就可以被认为是异常。为了实现这种类似于人类的比较的过程,本文作者采用了配准技术。本文作者认为,对于配准网络而言,只要知道如何比较两个极度相似的图像,图像的实际语义就不再重要,因此模型就更能够适用于从未见过的异常检测新任务。配准特别适用于少样本异常检测,因为配准可以非常方便地进行跨类别推广,模型无需参数微调就能够快速应用于新的异常检测任务。

图片

上图概述了基于配准的少样本异常检测的框架。与常规的异常检测方法(one-model-per-category)不同,这项工作(one-model-all-category)首先使用多类别数据联合训练一个基于配准的异常检测通用模型。来自不同类别的正常图像一起用于联合训练模型,随机选择来自同一类别的两个图像作为训练对。在测试时,为目标类别以及每个测试样本提供了由几个正常样本组成的支撑集。给定支撑集,使用基于统计的分布估计器估计目标类别注册特征的正态分布。超出统计正态分布的测试样本被视为异常。

图片

这项工作采用了一个简单的配准网络,同时参考了 Siamese [1], STN [2] 和 FYD [3]。具体地说,以孪生神经网络(Siamese Network)为框架,插入空间变换网络(STN)实现特征配准。为了更好的鲁棒性,本文作者利用特征级的配准损失,而不是像典型的配准方法那样逐像素配准,这可以被视为像素级配准的松弛版本。

实验结果


在与其他少样本异常检测方法的比较上,RegAD 无论在检测性能、适用到新类别数据的自适应时间上,相比于基准方法 TDG [4] 和 DiffNet [5] 都有显著的优势。这是由于其他的方法都需要针对新的类别数据进行模型的多轮迭代更新。另外,RegAD 相比于没有进行多类别特征配准联合训练的版本(RegAD-L),性能也得到了显著的提升,体现出基于配准的通用异常检测模型的训练是十分有效的。本文在异常检测数据集 MVTec [6] 和 MPDD [7] 上进行实验。更多的实验结果和消融实验可参考原论文。

图片

此外,作者还展示了异常定位可视化的结果。可以看到,联合训练可以使得模型的异常定位变得更加准确。

图片

T-SNE 的可视化也显示出,基于配准的训练可以使得同类别的正常图像特征变得更加紧凑,从而有利于异常数据的检出。

图片

总结


这项工作主要探索了异常检测的一个具有挑战性但实用的设置:1)训练适用于所有异常检测任务的单一模型(无需微调即可推广);2)仅提供少量新类别图像(少样本);3)只有正常样本用于训练(无监督)。尝试探索这种设置是异常检测走向实际大规模工业应用的重要一步。为了学习类别无关的模型,本文提出了一种基于比较的解决方案,这与流行的基于重建或基于单分类的方法有很大不同。具体采用的配准模型建立在已有的配准方案基础上,充分参考了现有的杰出工作 [1,2,3],在不需要参数调整的前提下,在新的异常检测数据上取得了令人印象深刻的检测效果。

参考文献
[1] Xinlei Chen and Kaiming He. Exploring simple siamese representation learning. CVPR. 2021.
[2] Max Jaderberg et. al. Spatial transformer networks. NeurIPS. 2015.
[3] Ye Zheng et. al. Focus your distribution: Coarse-to-fine non-contrastive learning for anomaly detection and localization. arXiv:2110.04538. 2021.
[4] Shelly Sheynin et. al. A hierarchical transformation-discriminating generative model for few shot anomaly detection. ICCV. 2021.
[5] Marco Rudolph et.al. Same same but differnet: Semi-supervised defect detection with normalizing flows. WACV. 2021.
[6] Paul Bergmann et. al. MVTec AD--A Comprehensive Real-World Dataset for Unsupervised Anomaly Detection. CVPR. 2019.
[7] Stepan Jezek et. al. Deep learning-based defect detection of metal parts: evaluating current methods in complex conditions. ICUMT. 2021.
理论ECCV 2022 Oral少样本异常检测框架上海人工智能实验室上交大
1
相关数据
图像重建技术

通过物体外部测量的数据,经数字处理获得三维物体的形状信息的技术。图像重建技术开始是在放射医疗设备中应用,显示人体各部分的图像,即计算机断层摄影技术,简称CT技术,后逐渐在许多领域获得应用。主要有投影重建、明暗恢复形状、立体视觉重建和激光测距重建。

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

异常检测技术

在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈、结构缺陷、医疗问题、文本错误等类型的问题。 异常也被称为离群值、新奇、噪声、偏差和例外。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

空间变换网络技术

自监督学习技术

一个例子中的内容特别多,而用一个例子做一个任务,就等于把其他的内容浪费了,因此我们需要从一个样本中找出多个任务。比如说遮挡图片的一个特定部分,用没遮挡部分来猜遮挡的部分是一个任务。那么通过遮挡不同的部分,就可以用一个样本完成不同任务。Yann Lecun描述的这个方法被业界称作「自监督学习」

推荐文章
暂无评论
暂无评论~