RGB-D Scene Classification via Multi-modal Feature Learning论文翻译

摘要 以前的方法大部分是用全局信息来进行场景的分类,并且把图像中所有的像素用来高级别的任务。它们只是把RGB和深度信息连接起来,没有探索RGB和深度的关系和互补性,也没有考虑局部特征的分布。从人的观点来看,我们识别物体的种类一般是通过:外观,纹理,形状和深度。不同物体之间的结构分布也要考虑。基于这个观察,建立一个中级别的物体区分性的表示应该会对场景分析很有效。作者提出了LM-CNN(new Con
相关文章
相关标签/搜索