学习笔记十二——Deformable Convolutional Networks

一、提出问题 视觉识别中一个关键挑战是如何在目标尺度,姿态,视点和部件变形中适应几何变化或建模几何变换,即适应物体的形变。 现有解决方法:1)建立具有足够期望变化的训练数据集。例如通过仿射变换增加现有数据样本,即学习足够多的数据使模型能够适应各种形状的物体。 2)使用变换不变的特征和算法。如SIFT(尺度不变特征变换)和基于滑动窗口的目标检测。 存在的缺点:1)针对第一个解决方法,几何变换被假定是
相关文章
相关标签/搜索