数据类别不平衡/长尾分布？不妨利用半监督或自监督学习

时间 2021-01-02

标签 python 栏目 Python 繁體版

原文原文链接

于类别不均衡的学习问题，利用 1.半监督学习 --- 也即利用更多的无标签数据； 2.自监督学习 --- 不利用任何其他数据，仅通过在现有的不平衡数据上先做一步不带标签信息的自监督预训练（self-supervised pre-training）都可以大大提升模型的表现，并且对于不同的平衡/不平衡的训练方法，从最基本的交叉熵损失，到进阶的类平衡损失[1][2]，重采样[3]，重加权[4][5

>>阅读原文<<