Video Understanding(视频理解)

CV领域图像已经登天很难短时间玩不出大花样大结构了(希望能早日打脸),大家开始打往视频上面靠的主意。由于早期限制于数据集和计算设备,多是从图像的2D模型直接转换成3D版本,如SIFT 3D,3D HOG,或者Dense Trajectory这种统治了很久的模型等,等到深度学习开始步入新的周期,数据集也开始扩增出现UCF101,ActivityNet,Charades,YouTube8M,Kinet
相关文章
相关标签/搜索