使用TVM优化深度学习GPU算子:深度卷积实例

如下内容翻译自:Optimize Deep Learning GPU Operators with TVM: A Depthwise Convolution Examplehtml 高效的深度学习算子是深度学习系统的核心。一般这些算子很难优化,而且须要高性能计算专家的努力。TVM,端到端张量IR/DSL堆栈,使得这项任务更容易。python 这个博客教你如何在TVM的帮助下编写高性能GPU运算核心
相关文章
相关标签/搜索