Semantic Visual Localization-论文阅读笔记

时间 2021-01-04

原文原文链接

本文提出了一个基于3D几何和语义信息进行视觉定位的新方法：具体实现方法：（1）采用RGB-D相机作为系统输入，分别对输入图像进行像素级的语义分割，并根据深度信息投影到3D空间中，融合得到体素级的3D语义地图。（2）根据语义类别对体素进行聚类，得到一个个subvolume个体。（3）采用变分编码-解码结构对subvolume进行处理，幻想出subvolume中被遮挡的部分（4）采用变分编码

>>阅读原文<<