谷歌研究所新论文:半监督学习的整体方法
半监督学习是利用未标记数据来减轻依赖大型标签数据集的有力范例。 Ian Goodfellow 之前在谷歌研究所与同事统一了当前用于半监督学习的主要方法从而生成新算法 MixMatch。前日发布的新论文描述该算法通过猜测数据增强未标记示例的低熵标签并使用 MixUp 混合标记和未标记数据来工作。 研究人员展示了 MixMatch 在许多数据集和标记数据量上获得大量优势,从而获得最先进的结果。 例如,在具有 250 个标签的 CIFAR-10 上错误率降低了 4 倍(从 38% 降至 11%),在 STL-10 上降低了 2 倍。 MixMatch 还可以帮助实现差异隐私的显著准确性。最后还有一项消融研究,以分析 MixMatch 的哪些成分对其成功最重要。