阿里云郑晓:浅谈GPU虚拟化技术(第四章)

对于“分片”的理解,相信大家已经不陌生了。此处的分片从两个维度上来定义:其一,是对GPU在时间片段上的划分,与CPU的进程调度类似,一个物理GPU的计算引擎在几个vGPU之间共享,而调度时间片一般都在1-10ms左右;其二,是对GPU资源的划分,主要是指对GPU显存的划分。以NVIDIA为例:一个物理GPU带有16GB的显存,那么按照16个vGPU来划分,每个vGPU得到1GB的显存。由于安全隔离
相关文章
相关标签/搜索