TVM: End-to-End Optimization Stack for Deep Learning

why TVM 要让AI芯片支持深度学习架构(如TensorFlow, MXNet, Caffe, and PyTorch,芯片都有自己的指令集(例如汇编,C语言),要将深度学习架构等部署到芯片上就需要将深度学习架构中的这些代码编译成芯片支持的指令集,所以要从头到尾设计一套软件栈,做一套全栈的优化。 所以现在的许多深度学习的架构只能在某一些厂商的GPU设备上获得加速,这种支持依赖于特定的GPU库,
相关文章
相关标签/搜索