计算机也可以看“视频”，理解“视频”

时间 2021-01-21

原文原文链接

联合编译：高斐章敏摘要我们将在文中介绍一种用于视频中动作检测的端对端方法，该方法用于学习直接预测动作的瞬时改变。我们认为，动作检测是一个对运动目标进行观察并细化假设的过程：观察视频中每一个动作变化瞬间，细化关于一个动作将何时发生的所有假设。基于该观点，我们将提出的模型视为一个基于递归神经网络结构的代理人程序，该代理人程序与视频进行交流互动。代理人程序观察视频帧序列，决定下一步观察哪里，何

>>阅读原文<<