LSTM模型的两种分解技巧

介绍 LSTM模型在语言模型,机器翻译等领域取得了非凡的成就,然后LSTM网络有几百万的参数以及需要数周在多GPU系统中进行训练。因此,一下介绍两种方法来缩减网络参数以及训练时间。两种方法分别为factorized LSTM(FLSTM)以及group LSTM(GLSTM)。 FLSTM FLSTM网络主要是将大的LSTM矩阵转化为两个小的矩阵。 LSTM模型简单介绍 在LSTM网络中, 其中
相关文章
相关标签/搜索