【原创 深度学习与TensorFlow 动手实践系列 - 4】第四课:卷积神经网络 - 高级篇网络
提纲:机器学习
1. AlexNet:现代神经网络起源性能
2. VGG:AlexNet加强版学习
3. GoogleNet:多维度识别优化
4. ResNet:机器超越人类识别设计
5. DeepFace:结构化图片的特殊处理blog
6. U-Net:图片生成网络图片
7. 实例:剖析VGG,用模型进行模型参数可视化,特征提取,目标预测ip
期待目标:深度学习
1. 掌握AlexNet结构特色,神经网络各层之间特征传导关系,模型参数总数计算
2. 了解VGG,GoogLeNet,ResNet等复杂ImageNet模型的结构特色,简单设计思想
3. 针对特殊数据,特殊任务设计的神经网络结构
4. 深度剖析VGG TF代码,学会对已有模型进行参数读取,目标预测,特征提取。
AlexNet:现代神经网络起源
背景介绍:
ImageNet Challenge:1000类物体,每类1000张图片
传统方法思路:
1. 图片特征提取
2. 机器学习分类
背景介绍:
2010年冠军
System Overview
Dense Grid descriptor:HOG,LBP
Coding:Local coordinate super-vector
Pooling, SPM
Linear SVM
2011年冠军:Xerox Lab
1. 特征提取
2. Fisher 压缩
3. SVM分类
VGG:AlexNet加强版
1. VGG-AlexNet 对比卷积层 - 卷积群参数个数:138m - 60m
2. 识别率(top5)7.3% - 15.3%
VGG做用:
1. 结构简单:同AlexNet结构相似,均为卷积层,池化层,全链接层的组合。
2. 性能优异:同AlexNet提高明显,同GoogleNet,ResNet相比,表现接近。
3. 选择最多的基本模型:方便进行结构的优化,设计,SSD,RCNN,等其余任务的基本模型(base model)
1. 为何ResNet有效?
1. 前向计算:低层卷积网络高层卷经济网络信息融合;层数越深,模型的表现力越强。
2. 反向计算:导数传递更直接,越过模型,直达各层。
人脸识别数据特色:
结构化:全部人脸,组成类似,理论上可以实现对齐
差别化:相同位置,形貌不一样