论文笔记(四):Temporal Action Localization by Structured Maximal Sums

 一、摘要 我们解决视频中时间动作定位问题。 将动作定位作为对任意长度时间窗口的结构化预测,其中每个窗口被评分为逐帧分类分数的总和。 此外,我们的模型将每个动作的开始,中间和结束分类为单独的组件,允许我们的系统明确地模拟每个动作的时间演变,并利用此结构中存在的信息时间依赖关系。 在这个框架中,我们通过搜索结构化最大和来定位动作,这是一个我们开发一种新颖,效率很高的算法解决方案的问题。 使用来自深度
相关文章
相关标签/搜索