Share:高性能深度学习支持引擎实战——TensorRT

This artical introduce TensorRT : https://developer.aliyun.com/article/580307 总结一下推断(Inference)和训练(Training)的不同: 推断(Inference)的网络权值已经固定下来,无后向传播过程,因此可以 1)模型固定,可以对计算图进行优化 输入输出大小固定,可以做memory优化(注意:有一个概念是f
相关文章
相关标签/搜索