在单GPU下,全部这些工具集都调用cuDNN,所以只要外层的计算或者内存分配差别不大其性能表现都差很少。前端
Caffe:python
1)主流工业级深度学习工具,具备出色的卷积神经网络实现。在计算机视觉领域Caffe仍然是最流行的工具包,他有不少扩展,可是因为c++
一些遗留的架构问题,它对递归网络和语言建模的支持不好。此外,在caffe种图层须要使用C++定义,而网络则使用protobuf定义。编程
2)caffe支持pycaffe接口,但这仅仅是用来辅助命令行接口的,而即使是是使用pycaffe也必须使用Protobuf.c#
3)基于C++,所以能够在多种是设备上编译,具备跨平台性,在部署方面是最佳选择。网络
4)性能简单快速架构
5)算平均水准,痛点在于须要使用C++定义图层,而模型须要使用protobuf定义。若是想支持CPU和GPU,用户还必须实现额外的函数如,Forward_gpu和Backward_gpu;框架
对于自定义的层类型,还必须为其分配一个int类型的ID,并将其添加到proto文件中。模块化
CNTK:函数
1)目前已经发展成为一个通用的、平台独立的深度学习系统。
2)没有python或者其余高级语言的接口。
3)与Caffe同样,也是基于C++而且是跨平台的,部署很是简单,但它不支持ARM构架,这限制了其在移动设备上的能力。
4)性能简单快速
TensorFlow:
1)是一个理想的RNN(递归网络神经)API和实现,TensorFlow使用向量运算的符号图方法,使得新网络的指定变得至关容易,但TensorFlow
并不支持双向RNN和3D卷积,同时公共版本的图定义也不支持循环和条件控制,这使得RNN的实现并不理想,由于必需要使用Python循环且
没法进行图编译优化。
2)支持python和c++接口。
3)因为它使用了Eigen而不是BLAS类库,因此可以基于ARM架构编译和优化。用户能够将训练好的模型部署到多种设备上面,不须要实现单独的
模型解码器或者加载python/LuaJIT解释器。他的模型能够部署到Windows设备上。
4)架构清晰,采用模块化设计,支持多种前端和执行平台
Theano:
1)支持大部分的先进网络,如今不少研究想法都源于Theano,他引领了符号图在编程网络中使用的趋势,Theano的符号API支持循环控制,让
RNN实现更加容易且高效。
2)支持python接口
3)缺乏底层接口,而且其python解释器也很低效,对工业用户而言缺乏吸引力。跨平台,模型可以部署到Windows环境上。
4)架构变态,整个代码库都是Python的,就来你C/cuda代码也要被打包为Python字符串,这使得它难以导航、调试、重构和维护。
Torch:
1)对卷积网络的支持很是好。TensorFlow和Theano中时域卷积能够经过conv2d来实现,但这样作有点取巧;
2)在luaJIT上运行,与c++\c#以及JAVA比较,速度至关快,性能更好,可是Lua不是主流的语言。
3)须要LuaJIT的支持,集成方面难度大,使得他的吸引力不如Caffe\CNTK\TensorFlow等直接支持C++框架。
Caffe、CNTK、TensorFlow和Theano都在全部的系统上运行,而Torch不支持Windows。