ScanNet: Richly-annotated 3D Reconstructions of Indoor Scenes

摘要 利用监督的深度学习方法的关键要求是大型,标记数据集的可用性。 不幸的是,在了解RGB-D场景的情况下,几乎没有可用的数据–当前的数据集覆盖了一小部分场景视图,并且语义注释有限。 为解决此问题,我们引入了ScanNet,它是一个包含15M场景中的2.5Mviews的RGB-Dvideo数据集,并带有3D相机姿势,表面重建和语义分割。 为了收集这些数据,我们设计了一个易于使用且可扩展的RGB-D
相关文章
相关标签/搜索