H, W, 3
H/R, W/R, 64
H/R * W/R * C
[0, 1]
H/R, W/R, K*2
Action tubelet detector for spatio-temporal action localization
说了不适用于AVA,但目前想使用AVA,不知道修改网络结构后效果如何,期待开源。