3D视觉系列:PoseCNN

1 创新点 提出新的位置估计表示形式:预测2d图片中心和距离摄像头距离(利用图像坐标来推测实际3D坐标)。而且经过hough投票来肯定物体位置中心。 提出新的姿态估计损失函数ShapeMatch-Loss:解决旋转对称物体姿态估计问题 提出新的数据集: YCB-Video dataset 2 论文思路 上述是整个网络结构图html bodynet是vgg16, 网络的预测输出共有3个。语义分割分支
相关文章
相关标签/搜索