基于FPGA的CNN算法移植(二)硬件架构

更多精彩内容,请微信搜索“FPGAer俱乐部”关注我们 这次我们来谈谈硬件架构,其实没啥好说的,就是科普的东西。因为这个玩意儿真的没啥新意         第一款:google的TPU 架构 图中DDR3仅仅是用来传送数据量小的权重,因为DDR3的速度实在是跟不上啊。而**值采用167GiB/S 的速度传入和传出,中间那个矩阵乘法器是65536个 ,运算力相当野蛮吧。中间就是一些控制逻辑——不同层
相关文章
相关标签/搜索