Semantic Visual Localization-论文阅读笔记

本文提出了一个基于3D几何和语义信息进行视觉定位的新方法: 具体实现方法: (1)采用RGB-D相机作为系统输入,分别对输入图像进行像素级的语义分割,并根据深度信息投影到3D空间中,融合得到体素级的3D语义地图。 (2)根据语义类别对体素进行聚类,得到一个个subvolume个体。 (3)采用变分编码-解码结构对subvolume进行处理,幻想出subvolume中被遮挡的部分 (4)采用变分编码
相关文章
相关标签/搜索