Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale... 论文笔记

1. 论文介绍 本文作者设计了一种通用的多尺度网络,仅需要通过少量的修改就能适用于三个不同的计算机视觉任务:深度估计,表面法向量估计,语义分割。给定输入图片,网络能够直接回归出输出图,如深度图、法向量图、分类图。网络结构在之前工作上加以改进,堆叠了 3 层卷积神经网络,从低分辨率逐渐升到高分辨率,进一步改善了图像细节。测试中,网络的输出是实时的,达到了 30Hz 左右,同时生成的结果在三项任务中都
相关文章
相关标签/搜索