利用TensorRT对深度学习进行加速

关于本文章的最新更新请查看:oldpan博客 前言 TensorRT是什么,TensorRT是英伟达公司出品的高性能的推断C++库,专门应用于边缘设备的推断,TensorRT可以将我们训练好的模型分解再进行融合,融合后的模型具有高度的集合度。例如卷积层和激活层进行融合后,计算速度可以就进行提升。当然,TensorRT远远不止这个: 我们平时所见到了深度学习落地技术:模型量化、动态内存优化以及其他的
相关文章
相关标签/搜索