图像处理之特征提取(一)之HOG特征简单梳理

图像处理之特征提取:HOG特征简单梳理

 

           HOG方向梯度直方图,这里分解为方向梯度与直方图。数组

1、方向梯度

梯度:在向量微积分中,标量场的梯度是一个向量场。标量场中某一点上的梯度指向标量场增加最快的方向,梯度的长度是这个最大的变化率。更严格的说,从欧几里得空间Rn到R的函数的梯度是在Rn某一点最佳的线性近似。在这个意义上,梯度是雅可比矩阵的一个特殊状况。
      在单变量的实值函数的状况,梯度只是导数,或者,对于一个线性函数,也就是线的斜率。函数

在图像中梯度的概念也是像素值变换最快的方向,把边缘(在图像合成中单一物体的轮廓叫作边缘)引入进来,边缘与梯度保持垂直方向。学习

                                                                                                     图1编码

方向梯度中的方向是如何肯定的?P0到P1的梯度方向:spa

                                                                                                        图2.net

具体在HOG中方向梯度的实现:首先用[-1,0,1]梯度算子对原图像作卷积运算,获得x方向(水平方向,以向右为正方向)的梯度份量gradscalx,而后用[1,0,-1]T梯度算子对原图像作卷积运算,获得y方向(竖直方向,以向上为正方向)的梯度份量gradscaly。而后再用如下公式计算该像素点的梯度大小和方向。blog

2、直方图

  直方图是一个图像处理中用的比较多的概念,想深刻了解,能够度娘一下。图片

3、方向梯度直方图HOG的提取

  方向梯度直方图为图像局部区域的梯度特征量统计,咱们为何要提取这个东东呢?get

     HOG主要应用于行人检测方面,以行人照片为例。图像处理

       

                                                                                                        图3

  上图是一张行人图的四种表示方式,原三色图,灰度图,边缘图,梯度图,人脑根据前期学习与先验知识很容易理解到图像中包含着一个行人,并能够根据必定状况将其从图像中抠选出来,但计算机是怎么思考的呢?怎样让计算机理解以上图像中包含的是一个行人呢?前三个图像如今状况不适用,因此选取梯度图,如今的梯度图一样也是人脑处理理解的平面结果,计算机是办不到的,须要将直观地的梯度图像转换成一种计算机容易理解的数据特征语言。

  

  对于64*128的图像而言,每8*8的像素组成一个cell,每2*2个cell组成一个块,以8个像素为步长,那么,水平方向将有7个扫描窗口,垂直方向将有15个扫描窗口。也就是说,64*128的图片,总共有36*7*15=3780个特征。这里截取梯度图的一部分画图进行理解,尺寸与比例并不精确。

                                                                                                          图4

 

  单独将其中一个8*8的小格拿出来,方向梯度中指的方向范围为2π,360°,为了画直方图咱们还须要选取合适的组距也就是bin,这里组距选取2π/9,也就是最后的直方图组数为9。下图为8*8像素的cell对应的方向梯度(未所有画出,共有8*8=64个)。

 

 

                                                                                                   图5

  将上面的64个方向梯度,按着直方图的参数设置进行画图,其中梯度的大小在统计数量中呈线性关系,好比梯度大小为2,则直方图对应增长2个单位,

        画出的对应直方图假设以下所示:

 

                                                                                                              图6

 

  把上图中单个cell对应的方向直方图转换为单维向量,也就是按规定组距对对应方向梯度个数进行编码,(8,10,6,12,4,5,8,6,14),获得单个cell的9个特征,每一个block(扫描窗口)包含2*2个cell也就是2*2*9=36个特征,一个64*128大小的图像最后获得的特征数为36*7*15=3780个。这样将一幅直观的梯度图经过分解提取变为计算机容易理解的特征向量。

  以上工做为HOG提取的主要内容,最后获得对应的行人的由方向梯度直方图HOG提取到的特征向量,可是计算机仍是不知道这个数据数组表明了什么意思,何时这组向量表明行人,何时表明其余东西,怎样train,最后经过不断地学习,然后在检测积累的基础上对对未知图像检测识别有没有行人呢?那就是后一步SVM要作的事了。

 

参考文献:

      目标检测的图像特征提取之(一)HOG特征