LBP原理介绍以及算法实现

有些读者可能会以为奇怪,上次推送怎么就忽然提及了双线性插值而不是继续介绍经典人脸识别的算法,实际上是由于在学习圆形LBP算子的时候发现须要用到双线性插值因而顺带介绍了一下。(由于我的缘由没常常看公众号的消息回复,致使有些读者留言超过两天没法回复,在这里说声抱歉。)web


前言算法

LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子;它具备旋转不变性和灰度不变性等显著的优势,用来提取图像的局部的纹理特征。微信


LBP特征的描述app

原始的LBP算子定义为在3*3的窗口内,以窗口中心像素为阈值,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,不然为0。这样,3*3邻域内的8个点经比较可产生8位二进制数(一般转换为十进制数即LBP码,共256种),即获得该窗口中心像素点的LBP值,并用这个值来反映该区域的纹理信息。具体图示以下:函数

通过计算,一个区域的图像就被咱们用一段十进制数表示出了纹理信息。学习


数学公式以下:spa


LBP的改进.net

看完基本LBP运算算子以后有些读者可能心里会有疑惑,若是某个区域是圆形或者其余尺寸怎么办?研究人员提出了如下的改进版本。orm


(1)圆形LBP算子blog

为了适应不一样尺度的纹理特征,并达到灰度和旋转不变性的要求,Ojala 等对 LBP 算子进行了改进,将 3×3 邻域扩展到任意邻域,并用圆形邻域代替了正方

形邻域,改进后的 LBP 算子容许在半径为 R 的圆形邻域内有任意多个像素点。从而获得了诸如半径为R的圆形区域内含有P个采样点的LBP算子,图示以下:

对于不是整数点的像素可使用双线性插值进行计算,具体计算方式在上一篇推文已经进行了介绍。


(2)LBP旋转不变模式

从 LBP 的定义能够看出,LBP 算子是灰度不变的,但却不是旋转不变的。图像的旋转就会获得不一样的 LBP值。 Maenpaa等人又将 LBP 算子进行了扩展,提出了具备旋转不变性的 LBP 算子,即不断旋转圆形邻域获得一系列初始定义的 LBP 值,取其最小值做为该邻域的 LBP 值,图示以下:


(2)LBP的等价模式

一个LBP算子能够产生不一样的二进制模式,对于半径为R的圆形区域内含有P个采样点的LBP算子将会产生2的P次幂种模式。很显然,随着邻域集内采样点数的增长,二进制模式的种类是急剧增长的。例如:5×5邻域内20个采样点,有2的20次幂=1,048,576种二进制模式。如此多的二值模式不管对于纹理的提取仍是对于纹理的识别、分类及信息的存取都是不利的。同时,过多的模式种类对于纹理的表达是不利的。例如,将LBP算子用于纹理分类或人脸识别时,常采用LBP模式的统计直方图来表达图像的信息,而较多的模式种类将使得数据量过大,且直方图过于稀疏。所以,须要对原始的LBP模式进行降维,使得数据量减小的状况下能最好的表明图像的信息。
  为了解决二进制模式过多的问题,提升统计性,Ojala提出了采用一种“等价模式”(Uniform Pattern)来对LBP算子的模式种类进行降维。Ojala等认为,在实际图像中,绝大多数LBP模式最多只包含两次从1到0或从0到1的跳变。所以,Ojala将“等价模式”定义为:当某个LBP所对应的循环二进制数从0到1或从1到0最多有两次跳变时,该LBP所对应的二进制就称为一个等价模式类。如00000000(0次跳变),00000111(只含一次从0到1的跳变),10001111(先由1跳到0,再由0跳到1,共两次跳变)都是等价模式类。除等价模式类之外的模式都归为另外一类,称为混合模式类,例如10010111(共四次跳变)(这是个人我的理解,不知道对不对)。
  经过这样的改进,二进制模式的种类大大减小,而不会丢失任何信息。模式数量由原来的
2的P次幂种减小为 P ( P-1)+2种,其中P表示邻域集内的采样点数。对于3×3邻域内8个采样点来讲,二进制模式由原始的256种减小为58种,这使得特征向量的维数更少,而且能够减小高频噪声带来的影响。


LBP的使用

在LBP的应用中,如纹理分类、人脸分析等,通常都不将LBP图谱做为特征向量用于分类识别,而是采用LBP特征谱的统计直方图做为特征向量用于分类识别。由于直接对两幅图片提取这种“特征”,并进行判别分析的话,会由于“位置没有对准”而产生很大的偏差。后来,研究人员发现,能够将一幅图片划分为若干的子区域,对每一个子区域内的每一个像素点都提取LBP特征,而后,在每一个子区域内创建LBP特征的统计直方图。如此一来,每一个子区域,就能够用一个统计直方图来进行描述;整个图片就由若干个统计直方图组成; 例如:一个100*100像素大小的图片,划分为10*10=100个子区域(能够经过多种方式来划分区域),每一个子区域的大小为10*10像素;在每一个子区域内的每一个像素点,提取其LBP特征,而后,创建统计直方图;这样,这幅图片就有10*10个子区域,也就有了10*10个统计直方图,利用这10*10个统计直方图,就能够描述这幅图片了。以后,咱们利用各类类似性度量函数,就能够判断两幅图像之间的类似性了。图示以下:



代码实现







本文分享自微信公众号 - 计算机视觉漫谈()。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。

相关文章
相关标签/搜索