MTCNN学习笔记

MTCNN由三个神经网络组成:pnet、rnet、onet 1、pnet 将原始图像缩放到不同尺度,形成图像金字塔 将每个尺度的金字塔都送入神经网络计算 pnet输入: (12,12,3) pnet需要判断该12*12*3的图像中是否有人脸,并给出人脸框和关键点的位置 1)face classification 输出向量形状为1*1*2,分别为该12*12*3是人脸的概率,以及不是人脸的概率 2)
相关文章
相关标签/搜索