Jetson TX2的计算能力

TX2的GPU算力

GPU的浮点计算理论峰值能力公式如下:

理 论 峰 值 = G P U 芯 片 数 量 * G P U B o o s t 主 频 * 核 心 数 量 * 单 个 时 钟 周 期 内 能 处 理 的 浮 点 计 算 次 数 理论峰值 = GPU芯片数量*GPU Boost主频*核心数量*单个时钟周期内能处理的浮点计算次数 GPUGPUBoost

TX2的参数如下:
在这里插入图片描述在这里插入图片描述

第五代的Pascal架构里,FP64单元和FP32单元的比例是1:2,

因此,TX2的单精度浮点计算能力为:
F P 32 c o r e s * 1302 M H z * 256 * 2 = 0.63 T F L O P S FP32 cores*1302MHz*256*2=0.63TFLOPS FP32cores1302MHz2562=0.63TFLOPS

TX2的双精度浮点计算能力为
F P 64 c o r e s * 1302 M H z * 128 * 2 = 0.31 T F L O P S FP64 cores*1302MHz*128*2=0.31TFLOPS FP64cores1302MHz1282=0.31TFLOPS

鉴于,P100还支持在一个FP32里同时进行2次FP16的半精度浮点计算,所以合理怀疑TX2具有这种能力,因此对于半精度的理论峰值更是单精度浮点数计算能力的两倍也就是达到1.26TFlops 。

在这里插入图片描述

这个结果符合官方文献资料的描述符合。

泰坦X的GPU算力

在这里插入图片描述
泰坦X的单精度浮点计算能力为
F P 32 c o r e s * 1531 M H z * 3584 * 2 = 10.6 T F L O P S FP32 cores*1531MHz*3584*2=10.6TFLOPS FP32cores1531MHz35842=10.6TFLOPS

泰坦X也属于第五代的Pascal架构里,FP64单元和FP32单元的比例是1:2, 因此,其双精度计算能力为:

F P 64 c o r e s * 1531 M H z * 1792 * 2 = 5.3 T F L O P S FP64 cores*1531MHz*1792*2=5.3TFLOPS FP64cores1531MHz17922=5.3TFLOPS