视频加强和超分是计算机视觉领域的核心算法之一,目的是恢复降质视频自己的内容,提升视频的清晰度。该技术在工业界有着重要的实用意义,并对于早期胶片视频的质量和清晰度的提高有着重大的意义。算法
根据数据类型分类,目前的超分辨工做分为图像超分和视频超分。网络
图像超分性能
图像超分领域随着卷积神经网络的应用,不断有新的网络结构取得更优的性能,如下 6 种结构是目前图像超分领域所使用的方法:学习
残差结构 目前超分领域广泛认为更深的网络可以带来更优性能,但更深的网络也带来训练困难的问题,残差结构可以缓解该问题,例如:EDSR;设计
多分支结构 从增长网络的宽度来提高性能,也是一种加强特征表达的方式,例如:REDNet;视频
(以上两种结构都会带来巨大的参数量)递归
循环结构 利用共享网络参数、循环递归的方式,在减小网络参数的状况下提高性能,例如:DRCN;图片
渐进式结构 把超分辩设计成多个阶段的网络结构,利用逐步增长分辨率的方式,提升超分性能,例如:SCN;get
注意力机制 提升特征的表达能力,从而提升性能,例如:RCAN、DRLN;class
对抗模型 利用 GAN 的思想生成更符合人眼视觉评价的高分辨率图片,例如:SRGAN、EnhanceNet、ESRGAN.
视频超分
视频超分与图像超分的区别主要有两点,包括:
视频帧对齐 由于视频中存在各类运动信息,因此存在参考帧和目标帧的误差,但超分辩通常须要利用邻帧跟参考帧作对齐;
视频帧融合 视频中存在运动模糊和场景切换的问题,如何有效融合视频帧,去除干扰信息,对最终的结果也有影响。
而在这两方面,视频超分的主要结构有如下几个类型:
三维卷积 直接利用 3D 卷积捕捉时域特征的功能,直接作帧间融合;
循环结构 可用于提取帧间关系,融合目标帧和参考帧的信息,例如: LSTM 的结构来作帧间融合;
滤波器预测 利用融合后的帧间信息预测滤波器参数,再经过滤波的方式作超分辩,得到自适应的滤波效果;
推荐阅读: