人脸识别与人体动做识别技术及应用
曹林 2015/8/1 电子工业出版社算法
1、绪论
一、国内外人脸库介绍:
1)、FERET人脸数据库:美军创建,在不一样姿态、表情、光照条件下采集,西方人构成,人种单一
2)、CMU-PIE人脸数据库:美卡梅隆大学创建,对姿态光照进行了严格控制
3)、YALE人脸数据库:耶鲁大学创建,15名志愿者
4)、OLR人脸数据库:剑桥大学AT&T实验室创建,经常使用研究数据库之一
5)、MIt人脸数据库:麻省理工大学创建,16名志愿者
6)、CAS-PEAL人脸数据库:中科院创建,对应不一样表情、光照、年龄、饰物等条件下
7)、BJUT—3D 3D人脸数据库:北京工业大学创建
8)、CHUK素描人脸数据库:香港大学创建数据库
二、对人脸识别技术的影响的因素:
光照:
解决办法:a、经过算法进行光照补偿处理,成本低但效果很差
b 、经过外部条件补光,效果好,成本大
姿态:
解决办法:a、加入其余类型姿态的人脸,比较麻烦
b 采用3D人脸,可旋转改变姿态
目标图像的分辨率:(分辨率高保留图像的信息高)
解决办法: a、加强监控设备
b利用图像超分辨率算法重建安全
三、图像超分辨率的介绍:
利用软件的方法将一幅或多幅低分辨率的图像重建成一幅高分辨率的图像
应用前景:
公共安全领域、医疗图像领域、卫星遥感图像领域、军事应用领域、数字电视领域、历史以及人文照片的复原
发展前景:
证件识别(护照等。。。)、刑侦破案、重要地方的监控系统、高清视频会议、人脸表情分析网络
四、低分辨率图像退化模型
退化模型:L(k)=DB(k)M(k)*H+n(k) (k是下标)机器学习
组成:运动形变、模糊、下采样、噪声
运动形变:实景与设备之间的相对运动
模糊:主要影响伊因素是光照
下采样:下采样会丢失图像部分信息
噪声:噪声对人的影响噪声能够理解为“ 妨碍人们感受器官对所接收的信源信息理解的因素”。而图像中各类妨碍人们对其信息接受的因素便可称为图像噪声 。学习
五、计算机视觉技术
目的:让计算机能对外界获取的信息进行智能化的分析与处理,模拟人脑功能
用途:提升视频监控、安防系统等智能化程度,以便充分发挥视频监控系统的主动监督做用、及时报警预防安全事故发生视频
六、人体行为视频数据库
Weizmann人体行为数据库:以色列科学院采集,在背景、拍摄角度不变状况下,采集10种不一样动做图片
KThan人体行为数据库:瑞典皇家理工学院采集,背景相对静止,镜头有拉近、远的操做,采集6种不一样动做图像处理
中科院人体行为数据库:中科院创建,拍摄角度为斜视、俯视、平视,包含单人以及多人交互行为,8中单人行为,多人交互行为有劫持、打架等模板
2、人脸图像配准和人脸检测跟踪
一、人脸配准
定义:将人脸图像分辨率变为一致,各个关键特征部位的坐标尽可能接近
2D人脸配准:(信息量少,特征点很少,配准比较容易,算法也比较成熟)
手动标定:直接手动操做获得各个特征点坐标再使用线性变换获得配准
利用人眼检测手段:寻找图像特征点再进行配准 (人眼滤波器)
二者之间:少许人眼检测须要进行手动校订:
3D人脸配准:
除了颜色信息、位置信息,3D人脸配准还多了深度
将3D转化为2D图像处理:
步骤:
一、获取纹理图像:将3D图像投射到XOY平面
二、检测特征点:利用人眼滤波器找到人眼位置,使用边缘检测找到人脸的大概位置
三、细化特征点位置:算法:ASM算法、VOSM算法(ASM算法的改进)
ASM算法原理:先创建形状模型、在局部灰度模型、后得到局部灰度特征模板
二、人脸检测
指对输入的视频或图片中,确认是否有人脸的存在,如有则将人脸位置框出的过程,各个类型的人脸种类越多,人脸检测算法的鲁棒性越好
人脸检测的两大类:非学习检测方法与学习检测方法
非学习检测方法:针对人脸的形状、肤色已经运动轨迹等进行检测(算法:Gobor图形检测,肤色检测),检测率不理想
学习检测方法:即机器学习的方法,
又可分为2类:非监督学习(错误与正确分类样本不予区分)
监督学习(在下一轮学习中会更多注意上一轮错分的样本)
** 机器学习的方法过程:**
一、将样本分类(正负样本)
二、以某个样本的特征进行分类,获得分类器
三、对各种特征进行循环处理,对特征进行组合,直到获得最好检测率,获得最终分类器
人脸检测的重要算法: 神经网络、支持向量机(SVM)、AdaBoost算法 神经网络: 支持向量机(SVM): AdaBoost算法: