智能视频分析技术指计算机图像视觉分析技术,是人工智能研究的一个分支,它在图像及图像描述之间创建映射关系,从而使计算机可以经过数字图像处理和分析来理解视频画面中的内容。智能视频分析技术涉及到模式识别、机器视觉、人工智能、网络通讯以及海量数据管理等技术。视频智能分析一般能够分为几部分:运动目标的识别、目标跟踪与行为理解。html
IVS原理前端
视频分析技术一般采用背景分离(背景减除)技术来进行图像变化的检测(全部的视频分析模式,如入侵、丢包、逆行等都是一种模式的图像变化)。其思路是对视频帧与基准背景图像进行比较, 相同位置的像素 (区域) 变化则认为是变化了的区域,对这些区域进一步处理、跟踪、识别,获得包括目标位置、尺寸、形状、 速度、 停留时间等基本形态信息和动态信息, 完成目标的跟踪和行为理解以后, 也就完成了图像与图像描述之间的映射关系, 从而使系统进一步进行规则断定,直到触发报警。算法
背景减除法是目前广泛使用的运动目标检测方法, 其算法自己须要大量的运算处理资源,而且仍然会受到光线、天气等天然条件及背景自身变化(海浪、云影、树叶摇动等状况)的影响。可是,针对不一样的天气以及天然干扰,已经有多种附加算法(过滤器)应用来弥补这些缺陷,随着芯片能力的提高及算法改进,相信视频分析技术会进一步成熟。后端
视频内容分析的关键技术服务器
前景目标的探测是视频分析技术实施的前提条件。 背景减除法是目前视频分析技术中用于前景目标探测的最多见方法, 其原理是利用当前图象和背景图象的差分(SAD)来检测出运动目标(区域)的一种方法。此方法能够提供比较完整的运动目标特征数据, 精确度和灵敏度比较高, 具备良好的性能表现, 但对动态场景的变化,如光线变化状况也比较敏感。背景减除法的工做原理以下图所示,当前图像与背景图像模型作差后造成运动目标区域,即图中的小船。网络
背景模型的创建是背景减除法的关键所在。 一般, 视频分析算法须要必定的时间进行“背景学习”, 所谓背景学习, 实质上是利用时间平均图像的方法, 将背景在一个时间段(如 30 秒钟)内的平均图像计算出来,做为该场景的背景模型。那么,“背景学习”时间结束后,系统仍然须要具备“背景维护”的能力,以前建模的背景并非一成不变的, 这样能保证系统对场景内的图像变化不那么敏感, 如光线变化、 影子等等, 所以, 开发出实用、 有效的背景模型以适应动态、复杂的场景是目标探测及视频分析技术的关键。架构
视频分析的工做流程性能
视频分析实质是人工智能的一部分,是经过模仿人类的工做过程来实现的。人类经过眼睛这个“传感器”实现视频的采集、 预处理、 处理而后将真实图像传送给大脑, 大脑并非对全部传送过来的图像进行总体的分析处理, 而是采用多层分级,将背景、缓慢移动及远处的目标分辨率最低化,忽略一些细节;并对前景感兴趣区进行二次聚焦 (咱们常说的眼前一亮就是这个意思) , 得到更多细节,而后对该区域进行断定。学习
以下图所展现的案例是平常生活中常见的状况,图像是一个地铁站台,画面中出现一个穿红色衣服的女子,手里拿着一个黑色包放到站台中的一个空地上,以后迅速离开。 这是一个很普通的视频场景, 值班人员对这段场景很容易迅速地提取出特征描述来,即“一个红衣女子将一个黑色包放在站台上后迅速离开”,而对这个简单的信息,值班人员利用眼睛采集到信息,首先是场景(站台),以后分离出感兴趣的前景目标(红衣女),以后对其跟踪,最后造成结论(丢下一个包),以后将整个过程的完整信息传给大脑去按规则断定。优化
不管采用何种视频分析架构, 其视频分析过程都是视频内容分析的算法模块“合力做业”的结果,视频分析基本过程以下图:
视频分析技术难点
视频分析技术自己并非一项新技术, 但其在视频监控系统中的应用还仅仅处于起步阶段,它给视频监控系统带来了颠覆性的革命,具备美好的发展远景。目前, 视频分析系统自己有一些技术问题有待提高, 下面是一些须要克服的技术难点。
天然天气变化:雨、 雪、 雾、 沙尘天气、 烟雾、 气流、 云影等, 体现的不只仅是光照的变化,而是真正的图像像素变化,这些“小假象”会致使系统视为场景中有物体在移动,从而干扰了真正的目标探测,浪费系统资源,所以,须要采用“过滤”机制将这些干扰作过滤处理。
背景的高频率变化:在视频图像背景中,可能出现摇动的树叶、晃动的波浪、光线反射、物体的反光、 草地的微动等等现象, 这些现象均可能形成画面像素出现变化, 从而致使误报。系统须要具备先进的过滤器,实现对规则往复性、细小运动进行过滤,使其集中精力在前景。
高速移动目标:视频分析系统基于自身算法及目前处理器的运算处理能力, 一般对非实时视频图像进行分析(如每秒采用 12 帧或 6 帧),这样当像素的采用频率比较低的时候, 视频分析算法须要连续分析必定数量的帧才能肯定是否报警, 而这时若是须要的分析时间长于入侵者经过防范区域的时间, 入侵者可能已经完成入侵动做而致使系统漏报。
视频分析的架构:目前, 在实际应用中, 视频分析产品主要有三种架构: 一种是基于后端的服务器(软件算法运行于 CPU);第二种是基于前端的 IPC 或 DVS;第三种是利用前端嵌入式视频分析设备(仅仅作视频分析,不作编码压缩工做)。其中,第三种方式是在嵌入式设备中固化视频分析模块, 利用网络客户端进行远程配置与报警管理。 三种架构也能够按照目前主流说法分红两大类, 即前端分析与后端分析。参见第上一章。须要注意的是, 对于视频分析功能, 最根本的考核是性能, 即良好的探测率和较低的误报率。 其实视频分析架构方式并非最重要的, 其实质都是视频分析算法来完成的,只不过是运行平台不一样,一个在 DSP上,一个在计算机的 CPU上,也不存在某种方式绝对好与坏, 实际应用中应该根据项目的规模、 前期设备的架构、用户的需求、网路建设等具体状况进行选择部署。
视频分析技术实施误区:视频分析的设置自己并不难,一般步骤是:选择好视场、明确分析模式,而后进行防区、分辨率、灵敏度、各类过滤器的选择和使用。设置视频分析的过程很快, 可是, 对一个通道视频分析进行参数微调、 现场模拟、 参数修正、 再模拟、算法优化、效果观察等工做倒是一个漫长而复杂的工做。在各环节中,要解决“提升探测率, 下降误报率”的问题, 必须长期地尝试和试验, 这也是视频分析厂家实验室产品和真正可投入应用的产品的最大区别。视频分析产品的真正考量在室外环境, 对于室内环境, 厂商基本能够进行模拟试验,问题不大。可是对于大型户外项目,环境复杂、遇到的问题比较多,系统调试阶段工做量比较大, 从调试到试运行, 可能须要不止一次的现场模拟、 参数微调、效果观察、统计、再模拟过程。每一个项目有本身的特色、一个项目中各点位有本身的特色, 各点位又有不一样的应用需求, 而且视频分析产品并不是是“即插即用”的产品, 所以必须针对不一样的项目、 不一样的点位、 不一样的需求进行有针对地实施。视频分析技术具备必定的复杂度, 国际上真正掌握视频分析算法的厂家并很少, 从掌握算法、 推出实验室产品到产品真正可以投入项目运行, 还有很长的路要走。 对于一些很是广泛的场景, 在实验室中进行模拟有必定困难, 所以许多厂家利用工程项目实施过程, 不断修正参数以适应不一样的环境, 这并不表明厂家的产品不成熟,反而是厂家实力的体现。
参考资料