物体检测与识别——学习笔记

前言

自动驾驶、手势控制、美颜相机网络

发展:机器学习

  • 50-60s 看
  • 70-90s 看懂
  • 90s-2012  识别
  • 2012++理解

传统方法

直线检测、形状检测学习

ADAS(Advanced Driver Assistant System)高级智能驾驶系统   见:ADAS系统-ADAS|车道偏离预警|前车碰撞预警|行人识别|3D高清全景 http://www.adas.cc/adas/#_20url

ADAS的核心功能集中在前车碰撞预警(FCW)、车道偏离预警(LDW)、行人检测预警(PCW)等。spa

检测圆形:找到一个点到边缘(由边缘检测来)的距离所有相等时,则断定区域覆盖为圆形。.net

 

机器学习方法

特征+模型blog

CNN 卷积层,提取特征相似HOG、LBP、Haarget

前面卷积和池化,提取特征博客

全链接FC,或softmax(本质是将逻辑回归的二分类问题向多分类扩展),分类it

卷积核(kernel、window)获得特征图(feature map)

 

sliding window

原始图滑窗很慢,改成在特征图上滑窗就很快

 

滑窗大量重复信息

 R-CNN(Regions with CNN features)

Region proposals 500-2000个可能区域。先相似K-means聚类,每个可能存在东西的部分都进模型检测

NMS 抑制掉周围方块

 

仍是感受R-CNN框太多了,仍是没法实时。

RCNN 提取特征用的是神经网络+SVM分类

Fast RCNN 特征+分类都是神经网络

Faster RCNN ,Region proposals也用神经网络(RPN寻找潜在region)

YOLO 图像分红若干cell,只回归一次,可将图像中全部物体全都提取出来。很是先进、豪华。

 

bounding box 位置定位

x,y,w,h连续变量——>回归(解决的是在哪)

侦测到物体在哪,画个框

 

semantic segmantation

图像语义分割  

更精细,像素级

 卷积:

上卷积(反卷积)

 

端对端

 

较新的技术:

MASK-RCNN 反卷积造成Mask

U-NET层数比较少,医学图像

 

【其余资料】

 关于semantic segmentation的几篇论文 - Marcovaldong的博客 - CSDN博客 https://blog.csdn.net/MajorDong100/article/details/78958656

计算机视觉之语义分割 http://blog.geohey.com/ji-suan-ji-shi-jue-zhi-yu-yi-fen-ge/

相关文章
相关标签/搜索