深度学习中的分类与回归任务

分类:输入一张猫的图片,最终要输出这张图片就是猫的概率; 定位:输入猫的图片,输出一个box,框出猫,得到这个box矩形的初始位置,用x,y表示,再得到矩形的宽和高; 分类+定位:不光要定位出猫的位置,还要确定这张图片就是猫。 首先,输入一张图片,经过一个CNN,提取出一个高维的特征,最后面一层不再接softmax进行分类,而是预测出4个坐标值,由[x,y,w,h]组成,那么如何来计算这四个值呢?
相关文章
相关标签/搜索