pytorch学习笔记(三十一):门控循环单元(GRU)

文章目录 前言 1. 门控循环单元 1.1 重置门和更新门 1.2 候选隐藏状态 1.3 隐藏状态 2. 读取数据集 3. 从零开始实现 3.1 初始化模型参数 3.2 定义模型 3.3 训练模型并创做歌词 4. 简洁实现 小结 前言 当时间步数较大或者时间步较小时,循环神经网络的梯度较容易出现衰减或爆炸。虽然裁剪梯度能够应对梯度爆炸,但没法解决梯度衰减的问题。一般因为这个缘由,循环神经网络在实际
相关文章
相关标签/搜索