视频预测算法vid2vid比MCNet好在哪里?

视频是一个时序性的图像,因此在模型中既须要捕捉时间相关性,也须要捕捉空间上的特征。时间相关性能够用LSTM这样的类RNN模型来捕捉,而空间相关性则须要CNN网络。更早一点的ConvLSTM单元就是这种思想。深度学习可以处理各类各样的问题,前提是根据问题自己须要设计相关的网络结构, MCNet和vid2vid是17年和18年比较优秀的视频序列处理算法,本文主要分析vid2vid网络与MCNet相比更
相关文章
相关标签/搜索