数字图像处理——图像的几何变换

     此次学习图像的 几何变换 ,主要有如下内容:

      ·图像的平移变换算法

      ·图像的镜像变换缓存

      ·图像的转置变换函数

      ·图像的旋转变换post

      ·图像的缩放学习

 

1、图像的平移变换优化

  在进行书写matlab代码以前,先来了解一下图像平移的理论基础。设图像的高度为H宽度为W,以下所示:spa

                          

咱们知道,图像是由像素组成的,而像素的集合就至关于一个二维的矩阵,每个像素都有一个“位置”,也就是像素都有一个坐标。假设原来的像素的位置坐标为(x0,y0),通过平移量(△x,△y)后,坐标变为(x1,y1),以下所示:3d

                     

用数学式子表示能够表示为:rest

              x1 = x0 + x,code

              y1 = y0 + y

用矩阵表示为:

                  

原本使用二维矩阵就能够了的,可是为了适应像素、拓展适应性,这里使用三位的向量。

式子中,矩阵:

                

称为平移变换矩阵(因子),△x和△y为平移量。

此外,咱们也知道了,图像的高度H其实也就是像素的行数,对于坐标1XH;图像的长度也就是像素的列数,对应坐标1YW

  上面是理论基础,下面咱们就用matlab实现一下图像的平移变换,相应的matlab代码以下所示:

close all ;


clear all ;


clc ;


im = imread('F:/图像处理/Koala.jpg');%读入一幅图


[H,W,Z] = size(im); % 获取图像大小,H为垂直方向768点,W为水平方向1024点


I=im2double(im);%将图像类型转换成双精度


res = ones(H,W,Z); % 构造结果矩阵。每一个像素点默认初始化为1(白色)


delX = 50; % 平移量X


delY = 100; % 平移量Y


tras = [1 0 delX; 0 1 delY; 0 0 1]; % 平移的变换矩阵


 


for x0 = 1 : H%第1行到第768行


    for y0 = 1 : W%第1列到第1024列


        temp = [x0; y0; 1];%将每一点的位置进行缓存,1行1列,1行2列···1行1024列


        temp = tras * temp; % 根据算法进行,矩阵乘法:转换矩阵乘以原像素位置


        x1 = temp(1, 1);%新的像素x1位置,也就是新的行位置(从1~768)


        y1 = temp(2, 1);%新的像素y1位置,也就是新的列位置(从1~1024)


        % 变换后的位置判断是否越界


        if (x1 <= H) & (y1 <= W) & (x1 >= 1) & (y1 >= 1)%新的行位置要小于新的列位置


            res(x1,y1,:)= I(x0,y0,:);%进行图像平移,颜色赋值


        end


    end


end;


 


set(0,'defaultFigurePosition',[100,100,1000,500]);%设置窗口大小


set(0,'defaultFigureColor',[1 1 1]);%设置窗口颜色


figure;%打开一个窗口,用来显示(多幅)图像


subplot(1,2,1), imshow(I),axis on ;%显示图片,一行两列,第一幅


subplot(1,2,2), imshow(res),axis on;%显示图片,一行两列,第二幅

咱们先来看一下效果,而后着重分析一下代码,效果以下所示:

 

而后下面咱们分析一下关键的代码:

  读入图像以后,获得im,咱们能够看到im是一个三维的变量,包括了像素的位置(高度(即垂直长度)和宽度(即水平长度)),像素的颜色。(注,24位真彩图:也是用矩阵表示,图像像素直接用RGB颜色显示,而不是经过颜色索引表。图像像素的颜色用三个变量表示即(R,G,B),每一个变量从0~255变化,所以一个像素也就是8bit*3=24bit,一个像素用24bit表示能够有2^24种颜色。)咱们能够看到会有unit8,就是8bit的缘由。

  而后咱们获取图像的大小,用H,W,Z三个变量接收,其中H接收了图片的高度(也就是垂直长度),W接收了图片的宽度(水平长度),而后Z接收了图片的颜色值

  而后咱们将图像转换成双精度类型I,这是由于使用双精度能够仿真在转换过程当中发生精度损失的问题,也是方便咱们进行转换。转换以后,咱们能够看到unit8的类型别咱们转换成了double类型。

  接着,咱们构造一个图像res矩阵,这个图像首先进行归一化,也就是让里面的元素所有为1,对于图像,就是一张白色的图片了。这个图像主要是用来“保存”咱们进行位移后的图像。

  而后咱们就设置平移量、构造平移变换矩阵。这个矩阵咱们根据前面的理论部分能够获得。

  接着即是重点了,进行平移变换。咱们来一句一句解读这个循环。当x0=1,y0=1时,获得第一个像素的位置,也就是(x0,y0)这个像素,而后将这个像素位置进行缓存,也就是构造一个矩阵temp,即理论中的:

                      

而后进行位置转换,也就是进行矩阵相乘,用变换矩阵乘以原像素矩阵,获得了变换后像素矩阵:

                       

  接着,咱们须要把变换后的像素位置“提取”出来,用x1y1进行存储;为何要获取位置呢?这是由于咱们要判断这个像素是否越界了,也就是进行平移以后,获得的这个像素位置是否还存在显示区域里面,也就是咱们的

        if (x <= H) & (y <= W) & (x >= 1) & (y >= 1) 语句

当还在显示区域里面时,咱们要进行移位显示:

            res(x1,y1,:)= I(x0,y0,:);%进行图像平移,颜色赋值

这个语句的含义是,把I中的RGB值(也就是颜色值)赋值给res,也就是说,前面矩阵相乘只是移动的像素位置,可是颜色没有进行移动,这里进行图像颜色的平移,当x0=1,y0=1时,把该点的位置图像颜色进行移动过去。

  当x0=1,y0=2时,移动第二点。咱们能够看到,这里的代码是:从左到右平移,也就是先进行宽度的平移;从上到下,进行高度的平移。当两个循环完成以后,图像也就像平移完成了。

  最后的代码就是显示图像了,其中axis on 的意思是打开左边,方便咱们进行查看平移后的位置。从上面的效果咱们能够获得,delx表示的高度的平移量,delx为正值时往下平移,delx为负值时往上平移;而dely表示的宽度的平移量,正值往右平移,负值往左平移。

 

 

2、图像的镜像变换

  图像的镜像变换分为水平镜像垂直镜像,下面分别进行这两种镜像的介绍,首先说明一下,不管是水平镜像仍是垂直镜像,镜像后高度和宽度都不变。

                        

              H图像的高度,关联x          W:图像的宽度,关联y

  ·水平镜像操做:以原图像的垂直中轴线为中心,将图像分为左右两部分进行对称变换。示意图以下所示:

                   

  水平镜像中,原图中的(x0,y0)通过水平镜像后,坐标变成了(x0,W-y0),用数学公式表达就是:

          x1 = x0,

          y1 = W-y0 ;

写成矩阵就是:

                    

也就是说,水平镜像变换矩阵(因子)为:

                          

matlab代码实现以下所示:

 

复制代码
close all ;
clear all ;
clc ;
im = imread('F:/图像处理/Koala.jpg');%读入一幅图
[H,W,Z] = size(im); % 获取图像大小,H为垂直方向768点,W为水平方向1024点
I=im2double(im);%将图像类型转换成双精度
res = ones(H,W,Z); % 构造结果矩阵。每一个像素点默认初始化为1(白色)
tras = [1 0 0; 0 -1 W; 0 0 1]; % 水平镜像的变换矩阵 
for x0 = 1 : H%第1行到第768行
    for y0 = 1 : W%第1列到第1024列
        temp = [x0; y0; 1];%将每一点的位置进行缓存,1行1列,1行2列···1行1024列
        temp = tras * temp; % 根据算法进行,矩阵乘法:转换矩阵乘以原像素位置
        x1 = temp(1, 1);%新的像素x1位置,也就是新的行位置(从1~768)
        y1 = temp(2, 1);%新的像素y1位置,也就是新的列位置(从1~1024% 变换后的位置判断是否越界
        if (x1 <= H) & (y1 <= W) & (x1 >= 1) & (y1 >= 1)%新的行位置要小于新的列位置
            res(x1,y1,:)= I(x0,y0,:);%进行图像颜色赋值
        end
    end
end;
set(0,'defaultFigurePosition',[100,100,1000,500]);%设置窗口大小
set(0,'defaultFigureColor',[1 1 1]);%设置窗口颜色
figure;%打开一个窗口,用来显示(多幅)图像
subplot(1,2,1), imshow(I),axis on ;%显示图片,一行两列,第一幅
subplot(1,2,2), imshow(res),axis on;%显示图片,一行两列,第二幅
复制代码

代码已经没有什么好介绍的了,跟前面的平移差很少,只不过变换矩阵水平镜像变化矩阵,获得的效果以下所示:

 

  ·垂直镜像操做:以原图像的水平中轴线为中心,将图像分为上下两部分进行对称变换。示意图以下所示:

             

  垂直镜像中,原图中的(x0,y0)通过垂直镜像后,坐标变成了(H-x0,y0),用数学公式表达就是:

        x1 = H - x0,

        y1 = y0 ;

写成矩阵就是:

                    

也就是说,垂直镜像变换矩阵(因子)为:

                        

matlab代码实现以下所示:

复制代码
close all ;

clear all ;

clc ;

im = imread('F:/图像处理/Koala.jpg');%读入一幅图

[H,W,Z] = size(im); % 获取图像大小,H为垂直方向768点,W为水平方向1024点

I=im2double(im);%将图像类型转换成双精度

res = ones(H,W,Z); % 构造结果矩阵。每一个像素点默认初始化为1(白色)

tras = [-1 0 H; 0 1 0; 0 0 1]; % 垂直镜像的变换矩阵

for x0 = 1 : H%第1行到第768行

    for y0 = 1 : W%第1列到第1024列

        temp = [x0; y0; 1];%将每一点的位置进行缓存,1行1列,1行2列···1行1024列

        temp = tras * temp; % 根据算法进行,矩阵乘法:转换矩阵乘以原像素位置

        x1 = temp(1, 1);%新的像素x1位置,也就是新的行位置(从1~768)

        y1 = temp(2, 1);%新的像素y1位置,也就是新的列位置(从1~1024% 变换后的位置判断是否越界

        if (x1 <= H) & (y1 <= W) & (x1 >= 1) & (y1 >= 1)%新的行位置要小于新的列位置

            res(x1,y1,:)= I(x0,y0,:);%进行颜色赋值

        end

    end

end;

set(0,'defaultFigurePosition',[100,100,1000,500]);%设置窗口大小

set(0,'defaultFigureColor',[1 1 1]);%设置窗口颜色

figure;%打开一个窗口,用来显示(多幅)图像

subplot(1,2,1), imshow(I),axis on ;%显示图片,一行两列,第一幅

subplot(1,2,2), imshow(res),axis on;%显示图片,一行两列,第二幅
复制代码

 

代码实现的效果以下所示:

 

 

 

3、图像的转置变换

  图像的转置就是将图像像素的x坐标和y坐标互换。这样将改变图像的高度和宽度,转置后图像的高度和宽度也将互换。

图像的转置用数学公式描述就是:

            x1 = y0,

                            y1 = x0;

写出矩阵以下所示:

         

matlab实现的代码以下所示:

复制代码
close all ;

clear all ;

clc ;

im = imread('F:/图像处理/Koala.jpg');%读入一幅图

[H,W,Z] = size(im); % 获取图像大小,H为垂直方向768点,W为水平方向1024点

I=im2double(im);%将图像类型转换成双精度

res = ones(H,W,Z); % 构造结果矩阵。每一个像素点默认初始化为1(白色)

tras = [0 1 0; 1 0 0; 0 0 1]; % 转置的变换矩阵

for x0 = 1 : H%第1行到第768行

    for y0 = 1 : W%第1列到第1024列

        temp = [x0; y0; 1];%将每一点的位置进行缓存,1行1列,1行2列···1行1024列

        temp = tras * temp; % 根据算法进行,矩阵乘法:转换矩阵乘以原像素位置

        x1 = temp(1, 1);%新的像素x1位置,也就是新的行位置(从1~768)

        y1 = temp(2, 1);%新的像素y1位置,也就是新的列位置(从1~1024% 变换后的位置判断是否越界

        if (x1 <= H) & (y1 <= W) & (x1 >= 1) & (y1 >= 1)%新的行位置要小于新的列位置

            res(x1,y1,:)= I(x0,y0,:);%进行图像颜色赋值

        end

    end

end;

set(0,'defaultFigurePosition',[100,100,1000,500]);%设置窗口大小

set(0,'defaultFigureColor',[1 1 1]);%设置窗口颜色

figure;%打开一个窗口,用来显示(多幅)图像

subplot(1,2,1), imshow(I),axis on ;%显示图片,一行两列,第一幅

subplot(1,2,2), imshow(res),axis on;%显示图片,一行两列,第二幅
复制代码

 

实现的效果以下所示:

 

 

 

4、图像的旋转

  通常状况下,旋转操做会有一个旋转中心,这个旋转中心通常为图像的中心,旋转以后图像的大小通常会发生改变。图像像素原来的坐标为(x0,y0),(顺时针)选择Θ角度后获得(x1,y1),用数学公式表达以下所示:

             x1 = x0·cosΘ + y0·sinΘ,

             y1 = -x0·sinΘ + y0·cosΘ;

用矩阵表示以下所示:

     

 

matlab中有直接实现图像旋转的函数,整理咱们就直接使用图像的旋转函数,代码以下所示:

复制代码
close all ;

clear all ;

clc ;

im = imread('F:/图像处理/Koala.jpg');%读入一幅图

res = imrotate(im,-30);

set(0,'defaultFigurePosition',[100,100,1000,500]);%设置窗口大小

set(0,'defaultFigureColor',[1 1 1]);%设置窗口颜色

figure;%打开一个窗口,用来显示(多幅)图像

subplot(1,2,1), imshow(im),axis on ;%显示图片,一行两列,第一幅

subplot(1,2,2), imshow(res),axis on;%显示图片,一行两列,第二幅
复制代码

这里主要是说明一下imrotate函数,这个函数就是对图像旋转的函数,输入是图像和旋转的角度,角度为正值时,逆时针旋转;角度为负值时,顺时针选择。代码实现的效果以下所示:

 

 

 

5、图像的缩放

  下面值来介绍一下图像的缩放主要是根据函数imresize来实现的,咱们先来看看代码和效果图,而后分析图像的缩放函数。代码和效果图像所示:

复制代码
close all ;

clear all ;

clc ;

 [im,map] = imread('Hydrangeas.bmp');%读入图片

im0 = imresize(im,0.26);%进行缩放到原来的0.26倍

im1 = imresize(im,1);%缩放原来的比例

im2 = imresize(im,3.5);%进行缩放到原来的3.5倍

im3 = imresize(im,[64 40]);%进行图像的缩放并设置图像的行列

im4 = imresize(im,1.6,'bilinear');%进行线性插值实现缩放

im5 = imresize(im,1.6,'triangle');

 

set(0,'defaultFigurePosition',[100,100,1000,500]);%设置窗口大小

set(0,'defaultFigureColor',[1 1 1]);%设置窗口颜色

figure;%打开一个窗口,用来显示(多幅)图像

subplot(1,2,1), imshow(im,map);%显示图片,一行两列,第一幅

subplot(1,2,2), imshow(im0,map);%显示图片,一行两列,第二幅

 

figure;%打开一个窗口,用来显示(多幅)图像

subplot(1,2,1), imshow(im,map);%显示图片,一行两列,第一幅

subplot(1,2,2), imshow(im1,map);%显示图片,一行两列,第二幅

 

figure;%打开一个窗口,用来显示(多幅)图像

subplot(1,2,1), imshow(im,map);%显示图片,一行两列,第一幅

subplot(1,2,2), imshow(im2,map);%显示图片,一行两列,第二幅

figure;%打开一个窗口,用来显示(多幅)图像

 

subplot(1,2,1), imshow(im,map);%显示图片,一行两列,第一幅

subplot(1,2,2), imshow(im3,map);%显示图片,一行两列,第二幅

 

figure;%打开一个窗口,用来显示(多幅)图像

subplot(1,2,1), imshow(im,map);%显示图片,一行两列,第一幅

subplot(1,2,2), imshow(im4,map);%显示图片,一行两列,第二幅

 

figure;%打开一个窗口,用来显示(多幅)图像

subplot(1,2,1), imshow(im,map);%显示图片,一行两列,第一幅

subplot(1,2,2), imshow(im5,map);%显示图片,一行两列,第二幅
复制代码

 

缩小:

 

 

等大:

 

 

放大:

 

 

缩放而且设置行列:

 

 

线性插值:

 

下面介绍一下imresize函数的使用信息(能够经过在matlab 使用help imresize查看):

该函数主要用来调整图像大小。

     B = imresizeASCALE返回一个图像,大小是原来的SCALE倍;A是灰度、RGB或者二进制图像。   

     B = imresizeA[NUMROWS  NUMCOLS]调整图像大小,使其具备指定数量的行和列。 NUMROWSNUMCOLS可能都是NaN,在这种状况下,将自动计算行数或列数,以便保留图像宽高比。   

    [YNEWMAP] = imresizeXMAPSCALE调整索引图像的大小,其中按照SCALE的倍数对原图像进行调整。   

    [YNEWMAP] = imresizeXMAP[NUMROWS NUMCOLS]调整索引图像的大小,经过调整行数和列数进行调整。   

    要控制imresize使用的插值方法,能够在上面的语法中添加一个METHOD参数,以下所示: 

        ASCALEMETHOD

        A[NUMROWS NUMCOLS]METHOD),

        imresizeXMAPMMETHOD

        imresizeXMAP[NUMROWS NUMCOLS]METHOD 

METHOD能够是一个命名通常插值方法的字符串:

        'nearest'  - 最近邻插值

          'bilinear'  - 双线性插值

          'bicubic'  - 三次插值;默认方法 

METHOD也能够是一个命名插值内核的字符串:

        'box'  用盒形内核插值 

        'triangle'  - 三角形内核插值  (至关于“双线性”) 

        'cubic' - 用立方核插值   (至关于“bicubic”)   

        'lanczos2' - Lanczos-2内核插值   

        'lanczos3' - 插入Lanczos-3内核 

    最后,METHOD能够是{fw}形式的双元素单元阵列,其中f是自定义内插内核的处理函数,w是自定义内核的宽度。在区间-w / 2 <= x <w / 2以外,fx)必须为零。可使用标量或向量输入来调用处理函数f

    能够经过使用上述任何语法以后的参数/值对来实现对imresize的附加控制。例如: 

        B = imresizeASCALEPARAM1VALUE1PARAM2VALUE2... 

参数包括:   

        'Antialiasing'真假指定缩小图像时是否执行抗锯齿。默认值取决于您选择的插值方法。对于'nearest' METHOD参数,默认值为false;对于全部其余方法,默认值为true 

        'Colormap' - (仅与索引图像相关) 'original' 或 'optimized';若是'original' ,则输出newmap与输入图相同。若是是“优化”,则会建立一个新的优化颜色映射。默认值为“optimized”。 

        'Dither' - (仅适用于索引图像)truefalse;  指定是否执行颜色抖动。默认值为true   

       'Method'  - 如上所述   

        'OutputSize' - 一个双元素向量[MROWS NCOLS] 指定输出大小。一个元素能够是NaN,在这种状况下,自动计算另外一个值以保留图像的宽高比。   

        'Scale' - 一个标量或两元素向量,指定调整大小的比例因子。若是它是标量,则将相同的比例因子应用于每一个维度。若是它是向量,它分别包含行和列尺寸的比例因子。 

例子:

    --------

使用默认的双三次插值和抗混叠缩小两倍:

        I = imread'rice.png';

        J = imresizeI0.5;

         figureimshowI), figureimshowJ

 使用最近邻内插收缩因子2    (这是最快的方法,但质量最差): 

        J2 = imresizeI0.5'nearest';

调整索引图像的大小: 

        [Xmap] = imread'trees.tif';

        [Ynewmap] = imresizeXmap0.5;

        imshowYnewmap

调整RGB图像的大小以得到64行,自动计算列数:

RGB = imread'peppers.png';

        RGB2 = imresizeRGB[64 NaN];

 

图像的几何变化差很少就到这里了,matlab中有不少函数能够实现图像的几何变换,这里就不详细说明了。