【视频行为识别】3D Convolutional Neural Networks for Human Action Recognition:

3D Convolutional Neural Networks for Human Action Recognition 一个卷积map的某一位置的值是通过卷积上一层的三个连续的帧的同一个位置的局部感受野得到的。 3D CNN架构包含一个硬连线hardwired层、3个卷积层、2个下采样层和一个全连接层。每个3D卷积核卷积的立方体是连续7帧,每帧patch大小是60x40; 1)应用了一个固定的
相关文章
相关标签/搜索