视频理解新方向:时域语言定位 综述

点击我爱计算机视觉标星,更快获取CVML新技术 本文原载于知乎,作者吴捷,目前于中山大学就读研究生。研究领域为计算机视觉与自然语言处理。 作者不仅综述了时域语言定位(Temporally Language Grounding)相关技术,还开源了多个state-of-the-art的实现,总结了一份资源列表,可谓相关研究者的端午佳节大福利~ 开源网址在文末,欢迎去GitHub给大佬加星。 一. 任务
相关文章
相关标签/搜索