2020李宏毅学习笔记——36.Network Compression(5_6)

5.Architecture Design Low Rank Approximation(低秩近似) 下图是低秩近似的简单示意图,左边是一个普通的全连接层,可以看到权重矩阵大小为 M*N ,而低秩近似的原理就是在两个全连接层之间再插入一层K。是不是很反直观?插入一层后,参数还能变少**?** 没错,的确变少了,我们可以看看新插入一层后的参数数量为: NK+KM=K*(M+N),因为K<M,K<N,
相关文章
相关标签/搜索