计算机也可以看“视频”,理解“视频”

联合编译: 高斐  章敏 摘要 我们将在文中介绍一种用于视频中动作检测的端对端方法,该方法用于学习直接预测动作的瞬时改变。我们认为,动作检测是一个对运动目标进行观察并细化假设的过程:观察视频中每一个动作变化瞬间,细化关于一个动作将何时发生的所有假设。基于该观点,我们将提出的模型视为一个基于递归神经网络结构的代理人程序,该代理人程序与视频进行交流互动。代理人程序观察视频帧序列,决定下一步观察哪里,何
相关文章
相关标签/搜索