有研究称,他们使用一种技术在一周内清理了 PASCAL VOC 2012 数据集中的 17120 张图像,并发现 PASCAL 中 6.5% 的图像有不同的错误(缺失标签、类标签错误等)。他们在创纪录的时间内修复了这些错误,并将模型的性能提高了 13% 的 mAP。
在 Hasty 平台上使用 AI Consensus Scoring 功能清洗 PASCAL VOC 2012;
使用 Faster R-CNN 架构在原始的 PASCAL 训练集上训练自定义模型;
使用相同的 Faster R-CNN 架构和参数,在清理后的 PASCAL 训练集上准备一个自定义模型;
实验之后,得出结论。
当 AI CS 检测到潜在错误时,我们尝试修复每张图像上所有可能出现的这些错误;
我们没有打算注释每个可能的目标,如果注释遗漏了一个目标,并且在前景中或在没有缩放的情况下肉眼可见,我们就注释它;
我们试图让边界框像像素一样完美;
我们还对部分(数据集类目标未注释部分)进行了注释,因为原始数据集具有它们的特性。
以 ResNet101 FPN 为骨干的更快的 R-CNN 架构;
采用 R101-FPN COCO 权值进行模型初始化;
模糊,水平翻转,随机剪切,旋转和颜色抖动作为增强;
AdamW 为求解器,ReduceLROnPlateau 为调度器;
就像在其他 OD 任务中一样,使用了损失组合(RPN Bounding Box 损失、RPN 分类损失、最终 Bounding Box 回归损失和最终分类损失);
作为指标,我们有 COCO mAP,幸运的是,它直接在 Model Playground 中实现。