计算机视觉—OpenCV入门(1)

1、计算机视觉

计算机视觉=图像处理+机器学习。图像处理技术用于将图像处理为适合进入机器学习模型中的输入,机器学习则负责从图像中识别出相关的模式。计算机视觉相关的应用很是的多,例如百度识图、手写字符识别、车牌识别等等应用。这个领域是应用前景很是火热的,同时也是研究的热门方向。随着机器学习的新领域深度学习的发展,大大促进了计算机图像识别的效果,所以将来计算机视觉界的发展前景不可估量。html

2、OpenCV简介

  OpenCV是计算机视觉领域应用最普遍的开源工具包,基于C/C++,支持Linux/Windows/MacOS/Android/iOS,并提供了Python,Matlab和Java等语言的接口,由于其丰富的接口,优秀的性能和商业友好的使用许可,不论是学术界仍是业界中都很是受欢迎。python

  OpenCV最先源于Intel公司1998年的一个研究项目,当时在Intel从事计算机视觉的工程师盖瑞·布拉德斯基(Gary Bradski)访问一些大学和研究组时发现学生之间实现计算机视觉算法用的都是各自实验室里的内部代码或者库,这样新来实验室的学生就能基于前人写的基本函数快速上手进行研究。因而OpenCV旨在提供一个用于计算机视觉的科研和商业应用的高性能通用库。算法

3、OpenCV的结构

  和Python同样,当前的OpenCV也有两个大版本,OpenCV2和OpenCV3。相比OpenCV2,OpenCV3提供了更强的功能和更多方便的特性。不过考虑到和深度学习框架的兼容性,以及上手安装的难度,这部分先以3.31版本为主进行介绍。网络

打开连接:https://opencv.org/releases.html框架

根据不一样的系统下载不一样的文件,我用的是MacBook,因此选择IOS pack,下载打开后以下图机器学习

根据功能和需求的不一样,OpenCV中的函数接口大致能够分为以下部分:ide

core:核心模块,主要包含了OpenCV中最基本的结构(矩阵,点线和形状等),以及相关的基础运算/操做。函数

imgproc:图像处理模块,包含和图像相关的基础功能(滤波,梯度,改变大小等),以及一些衍生的高级功能(图像分割,直方图,形态分析和边缘/直线提取等)。工具

highgui:提供了用户界面和文件读取的基本函数,好比图像显示窗口的生成和控制,图像/视频文件的IO等。性能

若是不考虑视频应用,以上三个就是最核心和经常使用的模块了。针对视频和一些特别的视觉应用,OpenCV也提供了强劲的支持:

video:用于视频分析的经常使用功能,好比光流法(Optical Flow)和目标跟踪等。

calib3d:三维重建,立体视觉和相机标定等的相关功能。

features2d:二维特征相关的功能,主要是一些不受专利保护的,商业友好的特征点检测和匹配等功能,好比ORB特征。

object:目标检测模块,包含级联分类和Latent SVM

ml:机器学习算法模块,包含一些视觉中最经常使用的传统机器学习算法。

flann:最近邻算法库,Fast Library for Approximate Nearest Neighbors,用于在多维空间进行聚类和检索,常常和关键点匹配搭配使用。

gpu:包含了一些gpu加速的接口,底层的加速是CUDA实现。

photo:计算摄像学(Computational Photography)相关的接口,固然这只是个名字,其实只有图像修复和降噪而已。

stitching:图像拼接模块,有了它能够本身生成全景照片。

nonfree:受到专利保护的一些算法,其实就是SIFT和SURF。

contrib:一些实验性质的算法,考虑在将来版本中加入的。

legacy:字面是遗产,意思就是废弃的一些接口,保留是考虑到向下兼容。

ocl:利用OpenCL并行加速的一些接口。

superres:超分辨率模块,其实就是BTV-L1(Biliteral Total Variation – L1 regularization)算法

viz:基础的3D渲染模块,其实底层就是著名的3D工具包VTK(Visualization Toolkit)。

从使用的角度来看,和OpenCV2相比,OpenCV3的主要变化是更多的功能和更细化的模块划分。

4、安装开发环境

我使用的是Anaconda3 + python3.6 + Tensorflow + opencv3

一、Anaconda的安装

Mac OS系统:https://blog.csdn.net/ff_smile/article/details/78871294

Window系统:https://jingyan.baidu.com/article/eae078275a31851fec5485b8.html

liunx系统:https://www.jianshu.com/p/03d757283339

Anaconda和包的安装和使用教程:https://www.cnblogs.com/alummox/p/7887211.html

二、opencv的安装

Mac安装(其余包安装原理同样):

其余系统安装:https://www.cnblogs.com/minsons/p/7966190.html

5、图片的基础处理

一、引入opencv

import cv2
复制代码

二、引入图片

函数imread从指定文件加载图像并返回它。若是图像没法读取(因为文件丢失,权限不当,格式不受支持或格式无效),函数返回一个空矩阵(Mat :: data == NULL)

openCV目前支持的图片格式

  • Windows位图文件 - BMP, DIB;
  • JPEG文件 - JPEG, JPG, JPE;
  • 便携式网络图片 - PNG;
  • 便携式图像格式 - PBM,PGM,PPM;
  • Sun rasters - SR,RAS;
  • TIFF文件 - TIFF,TIF;
  • OpenEXR HDR 图片 - EXR;
  • JPEG 2000 图片- jp2。
# 一、文件的读取 二、封装格式解析 三、数据解码 四、数据加载
img = cv2.imread('canton.jpg',1)
复制代码

三、图片的读取和展现

cv2.imshow('image',img)
# jpg png 一、文件头 二、文件数据
cv2.waitKey (0)
# waitKey(0),以毫秒为单位延迟。0是指“永远”的特殊值
复制代码

四、图片的写入

cv2.imwrite('canton01.jpg',img)
复制代码
True
复制代码

五、不一样图片的质量保存

图像占用内存空间的大小:分辨率 * 位深 / 8
分辨率:宽 * 高
位深度:指定图像中的每一个像素可使用的颜色信息数量。
每一个像素使用的信息位数越多,可用的颜色就越多,颜色表现就更逼真。
例如:
一幅图像分辨率:1366*768,24位,则其大小计算以下:
大小 = 1366 * 768 * 24 / 8 = 3147264 byte = 3147 KB

cv2.imwrite('canton02.jpg',img,[cv2.IMWRITE_JPEG_QUALITY,50])
# JPG 的数值越低,压缩比越高,范围0~100
复制代码

结果:

True
复制代码
cv2.imwrite('canton03.png',img,[cv2.IMWRITE_PNG_COMPRESSION,0])
# PNG 的数值越低,压缩比越低,范围0~9
复制代码

结果:

True
复制代码

六、像素读取写入

(b,g,r) = img[123,100]
print(b,g,r)
复制代码

结果:

116 129 167
复制代码

七、添加像素

for i in range(1,100):
    img[10 +i,100] = (255,0,0)
cv2.imshow('image',img)
cv2.waitKey(0)
复制代码

本文章,若有侵权,联系删除