阿里云郑晓：浅谈GPU虚拟化技术（第四章）

时间 2021-01-17

原文原文链接

对于“分片”的理解，相信大家已经不陌生了。此处的分片从两个维度上来定义：其一，是对GPU在时间片段上的划分，与CPU的进程调度类似，一个物理GPU的计算引擎在几个vGPU之间共享，而调度时间片一般都在1-10ms左右；其二，是对GPU资源的划分，主要是指对GPU显存的划分。以NVIDIA为例：一个物理GPU带有16GB的显存，那么按照16个vGPU来划分，每个vGPU得到1GB的显存。由于安全隔离

>>阅读原文<<