AI芯片:深鉴科技基于深度压缩的ESE方案分析

ESE 这篇论文,将之前介绍的韩松的Deep Compression技术在FPGA上具体实现。 为了达到更高的效率,论文的设计从三个层次提高计算效率:算法优化,编译高效的调度程序,硬件加速。如Figure 2所示。 论文设计的语音识别系统中,最占用运算资源和存储资源的是LSTM算法。故论文着重优化LSTM算法的计算。 LSTM算法的数据流如图Figure 4所示。的确比较复杂。其中涉及到许多的矩阵
相关文章
相关标签/搜索