Multi-class Multi-label Multi-task区别

三者的区别如下:

  • Multi-class classification 多值分类。比如年龄预测中把人分为小孩、青年人、中年人、老年人这四个类别,对应{0,1,2,3}。Multiclass classification 与 binary classification相对应,性别预测只有男、女两个值{0,1},就属于后者。

  • Multi-label classification 多标签分类。比如定义新闻稿相关的三元向量,该向量第1、2和3个元素分别对应是否(分别取值1或0)与政治、体育和自然话题相关,一个新闻稿A可以与{政治,体育,自然}有关,就可以打上这三个标签,用向量[1,1,1]来表示。而新闻稿B可能只与其中的{体育,自然}相关,用向量[0,1,1]来表示。

  • Multi-task classification 多任务分类。举前边的新闻稿的例子。新闻稿A可以表示为[1,1,1],而新闻稿B可以表示为[0,1,1],这也可以看成是Multi-task classification 问题。 但Multi-label classification 是一种特殊的Multi-task classification 问题,是向量的元素取值可能只有两种的时候。当向量的元素取值的可能性大于两种时,比如同时要求预测年龄和性别,其中年龄有四个取值,而性别有两个取值,则不属于Multi-label问题了,但仍然是Multi-task。