详解机器学习中的梯度消失、爆炸缘由及其解决方法

时间 2020-07-07

标签详解机器学习梯度消失爆炸缘由及其解决方法繁體版

原文原文链接

前言本文主要深刻介绍深度学习中的梯度消失和梯度爆炸的问题以及解决方案。本文分为三部分，第一部分主要直观的介绍深度学习中为何使用梯度更新，第二部分主要介绍深度学习中梯度消失及爆炸的缘由，第三部分对提出梯度消失及爆炸的解决方案。有基础的同鞋能够跳着阅读。其中，梯度消失爆炸的解决方案主要包括如下几个部分。html - 预训练加微调 - 梯度剪切、权重正则（针对梯度爆炸） - 使用不一样的激活函数 -

>>阅读原文<<