cFSMN和FSMN参数规模对比分析

时间 2019-11-20

标签 cfsmn fsmn 参数规模对比分析繁體版

原文原文链接

(1)分析前提：编码

(2)结构图回顾：spa

(3)公式回顾：3d

\[ \vec{\tilde{h}_t^l} = \sum_{i=0}^{N}\vec{a_i^l}\odot\vec{h_{t-i}^l},in...vFSMN \]blog

\[ A^l =\{ \vec{a_0^l},\vec{a_1^l},...,\vec{a_N^l}\},in...vFSMN \]class

\[ \vec{h_t^{l+1}} =f(W^l\vec{h_t^l}+\tilde{W}^l\vec{\tilde{h}_t^l} +\vec{b^l} ) \]im

(4)参数规模分析img

由第一个公式和第二个，可知这一部分的参数规模为：n × tdi

由第三个公式，可知这一部分的参数规模为：n × n + n × nco

因此总的参数规模为：n × n + n × n + n × tdisplay

(1)分析前提：

(2)结构图回顾：

(3)公式回顾：

\[ \vec{p_t^l} =V^l\vec{h_t^l}+\vec{b^l} \]

\[ \vec{\tilde{p}_t^l} = \vec{p_t^l}+\sum_{i=0}^{N}\vec{a_i^l}\odot \vec{p_{t-i}^l} \]

\[ \vec{h_t^{l+1}} =f(U^l\vec{\tilde{p}_t^l} +\vec{b^l} ) \]

(4)参数规模分析

由第一个公式和假设，可知这一部分的参数规模为：x × n

由第二个公式，可知这一部分的参数规模为：x × t

由第三个公式，可知这一部分的参数规模为：x × n

因此总的参数规模为：n × x + n × x+ x × t

FSMN的参数规模为：n × n + n × n + n × t

cFSMN的参数规模为：n × x + n × x+ x × t

因此：cFSMN相比于FSMN，减小的参数规模为： (2n+t) × (n-x)

进一步的，实际上n很大，能够忽略t的影响，因此上式能够近似为：2n × (n-x)

能够看到，若是取x为n的一半，较少的参数规模就是n²

近似分析的结果，就是参数规模能够减小的量级为：O(n²)