脉动阵列的深入

     传统卷积使用K个LineBuffer也就是K个shifter来将数据流进行二维并行化,实际上是传统的一维串并转化(使用移位寄存器进行转化)的二维拓展,这种并行暂时叫做结构并行       而脉动阵列的实质上是一个二维流水线的形式,为什么呢       图中的每一个数据传播路径上均有一个reg,因此每一个PE实际上是在单独计算的,和其他的PE的数据流可以使用reg隔开。如果我们只看行或者列
相关文章
相关标签/搜索