深度学习中多GPU训练

针对这个问题: 深度学习中多GPU训练是否等价于增大batch size? - 知乎 https://www.zhihu.com/question/323307595web 先说我认为的结论,若夸卡训练中有统计数据同步(好比BN层的runing average 和 variance),这时单卡和多卡效果是同样的,只不过多卡增大了batch size,不然就不是严格的增大batch,由于统计数据可能
相关文章
相关标签/搜索