读 “Multi-target tracking by lagrangian relaxation to min-cost network flow, CVPR,2013”小结。node
昨晚老板让看一下这篇文章写几句总结给他,因此就看了看,今天顺便简单总结一下这篇文章。算法
这篇文章模型的核心依然是网络流算法,但和通常网络流算法不一样点在于:通常方法在构建图时直接将每个observation做为node,而observation之间的相互关系使用edge表示,这样每一个edge表示的时相连node之间的类似度或者关联程度;而这篇文章所提模型中,在构建图时使用的是candidate pair做为node,而后pair of candidate pairs之间存在这edge,经过这种方式,可以将连续三帧之间的高阶信息,好比连续三帧之间速度近似恒定,融入到模型中。而正是因为不一样的构图方式,致使必须引入一些附加的约束以知足多目标跟踪中 track-detection之间的一对一关系。对于提出的模型,经过适当的拉格朗日松弛能够转化为通常的网络流算法有效求解。数据库
使用一个简单的例子清楚的阐述了模型的构图方式。
假设如今有连续的三帧图像的observations。第一帧有3个表示为1,2,3,第二帧有两个表示为4,5,第三帧3个表示为6,7,8.通常网络流算法的构图方式以下(这里没有添加源点和汇点)网络
形式化表述模型。svg
现有长度为的图像序列,第
帧中有
个observations,其集合表示为
,
表示第k帧的第i个目标。
相邻帧之间可能的匹配对是一个二元组,表示为,这些可能的匹配能够由表观类似度,距离类似度等得到。 帧k与k+1之间全部可能的匹配个数表示为
,其集合表示为
。 那么整个序列中nodes个数为
,其总的集合表示为
.spa
由图2进一步细化的图以下:G=(V,E),其中V包含源点s和汇点t,以及每个match连接的两个observations,称为incoming node和outgoing node。.
将每一个match表示成两个nodes有两个好处:
1.因为每条边的流量最大为1和流量平衡约束,那么离开outgoing点的流量最多只能为1,由于只有一条进入的link
2.这么作能够将通常网络流算法中unary和binary约束直接添加到match内部的link上,而高阶信息都放在了match与match之间deges上了。3d
整个模型表示以下orm
其中表示边ij的代价,(1)表示最小代价,(2)表示二值约束,(3)表示流量平衡约束,(4)表示附加的用于一一对应的约束。(1)(2)(3)就是通常的网络流算法模型,针对于约束(4),
表示第s个由outgoing和incoming点重合的matches构成的集合,整个序列总共有q个这种集合。blog
为了求解该模型,将约束(4)经过拉格朗日松弛放到目标式中,而后就能够转换为通常的网络流算法模型进行求解。ip
其中表示拉格朗日乘子
由于一些约束可能自己过强,始终不可能知足,因此迭代过程可能一直不收敛,这是采用限制最大迭代次数的方式终止算法。
对迭代获得的结果进一步后处理:
链接选中的matches组成tracks
将存在冲突的track拎出来放到一个“competing tracks”的list中
在conflicted tracks中选择lowest cost的track做为正确的track取出
针对于conflicted tracks剩下的tracks,剔除冲突的match看其是否依然可以知足轨迹的条件,好比先后光滑,长度等,知足则建立新的轨迹,不知足就扔掉。
文中分别在psu,TUD和ETHMS数据库上进行了实验,具体实验结果参见论文。
1.该模型相对于通常的网络流算法使用了更高阶的信息 2.但这里的更高阶也仅仅是3阶的信息,如今有一些利用更高阶信息的方法提出,比基于如张量秩一近似的多目标跟踪。 3.模型经过拉格朗日松弛能够有效的转化为通常的网络流算法求解。 4.针对于算法不收敛的情形,采用了一种贪婪算法做为强制算法结束的补