【论文阅读笔记】VNect: Real-time 3D human Pose Estimation with a Single RGB

论文总结:   文中方法比较简单,通过全卷积CNN预测一个heatmap及location map。location map实际上就是X, Y, Z三个方向的坐标图,找到关键点的过程为heatmap 中寻找照最大值(x, y),则在对应的X, Y, Z找到对应位置的点,组成相对根节点的3D坐标。   由于这种3D pose估计是通过单帧进行的,无法考虑前后信息,无法在视频时间上保持动作的一致性,所
相关文章
相关标签/搜索