GPU中的SM和wrap的关系

介绍 我们在cpu上做好了准备工作,然后将指令发送给GPU, 在这里我们看到grid为10,block为128,也就说有10个block,每一block有128个thread, 如何分配这些block? 原则 在GPU中一个block是不能拆分到两个SM中 一个SM中的block要满足SM的条件限制 SM有哪些限制? 简单有这些,当然还有其他的没有展示,这里数值都是我瞎编的,具体的可以去官网文档查
相关文章
相关标签/搜索