deep learning激活函数实现之cudnn

代码不方便上传,只能传图片。 注意:cudnn对于输入的维度限制为4~8,少于4维的数据可以把多余的维度的shape设置为1,多余8维的数据则无能为力了。cudnn对于输入数据的size限制为最多20亿,也就是说输入数组的元素的个数最多为20亿。 先看kernel头文件: kernel cpp文件: run:
相关文章
相关标签/搜索