如何设计一颗40PFLOPS量级的AI芯片?

作者 | 唐杉 来源 | 公众号StarryHeavensAbove Nvidia刚刚发布的最强“GPU”DGX-2,由16颗V100+12颗NVSwitch芯片组成,能够提供2PFLOPS。而单颗V100的Deep Learning处理能力是120TFLOPS。如果我们要设计一颗能够实现40PFLOPS处理能力的AI芯片,该怎么操作?其实挺“简单”,把芯片面积尽可能做大。那么单个裸片(Die),
相关文章
相关标签/搜索