MIT大神利用半监督or自监督学习,巧妙破解数据不平衡问题
这项工作主要研究一个经典而又非常实际且常见的问题:数据类别不平衡(也泛称数据长尾分布)下的分类问题。来自 MIT 的两位作者通过理论推导和大量实验发现,半监督和自监督均能显著提升不平衡数据下的学习表现。论文第一作者杨宇喆,MIT 计算机科学与人工智能实验室博士生,本科毕业于北京大学。研究方向为:基于深度学习的无线感知,鲁棒机器学习,强化学习。论文链接:https://arxiv.org/pdf/2006.07529.pdfhttps://github.com/YyzHarry/imbalanced-semi-self。目前代码(以及相应数据,30多个预训练好的模型)已开源,Github链接如下:https://github.com/YyzHarry/imbalanced-semi-self。