论文笔记 —— StereoNet: Guided Hierarchical Refinement for Real-Time Edge-Aware Depth Prediction

上图所示为网络架构,蓝色方框之前的部分是粗粒度的深度估计,这部分首先通过 Encoder 的结构进行图像特征提取,然后将左右两个图片的特征得到相应的 Cost Volume, 之后利用三维卷积操作得到 1/8 分辨率的深度图。 粗粒度的深度估计 提取特征:左右图共享权值的暹罗网络(Siamese Network)分别提取左右图的特征,使用 K 个 5*5 的卷积层进行下采样操作(K 通常取 3 或
相关文章
相关标签/搜索