76分钟训练BERT!谷歌深度学习的大批量优化研究被ICLR 2020接收

点击上方“深度学习技术前沿”,选择“星标”公众号 资源干货,第一时间送达 爱也BERT,恨也BERT!BERT是史上最强的NLP模型之一,但却也是工业界目前最耗时的应用,计算量远高于ImageNet!谷歌的研究人员提出新的优化器,将BERT的训练时间从3天成功缩短到76分钟!该论文已被ICLR 2020接收。 谷歌发布的史上最强NLP模型之一BERT,是NLP领域的一项重大突破。 随着大规模数据集
相关文章
相关标签/搜索