深度学习框架caffe/CNTK/Tensorflow/Theano/Torch的对比

时间 2019-11-12

标签深度学习框架 caffe cntk tensorflow theano torch 对比繁體版

原文原文链接

在单GPU下，全部这些工具集都调用cuDNN,所以只要外层的计算或者内存分配差别不大其性能表现都差很少。前端

Caffe:python

1）主流工业级深度学习工具，具备出色的卷积神经网络实现。在计算机视觉领域Caffe仍然是最流行的工具包，他有不少扩展，可是因为c++

一些遗留的架构问题，它对递归网络和语言建模的支持不好。此外，在caffe种图层须要使用C++定义，而网络则使用protobuf定义。编程

2）caffe支持pycaffe接口，但这仅仅是用来辅助命令行接口的，而即使是是使用pycaffe也必须使用Protobuf.c#

3）基于C++，所以能够在多种是设备上编译，具备跨平台性，在部署方面是最佳选择。网络

4）性能简单快速架构

5）算平均水准，痛点在于须要使用C++定义图层，而模型须要使用protobuf定义。若是想支持CPU和GPU，用户还必须实现额外的函数如，Forward_gpu和Backward_gpu;框架

对于自定义的层类型，还必须为其分配一个int类型的ID,并将其添加到proto文件中。模块化

CNTK:函数

1）目前已经发展成为一个通用的、平台独立的深度学习系统。

2)没有python或者其余高级语言的接口。

3）与Caffe同样，也是基于C++而且是跨平台的，部署很是简单，但它不支持ARM构架，这限制了其在移动设备上的能力。

4）性能简单快速

TensorFlow:

1）是一个理想的RNN（递归网络神经）API和实现，TensorFlow使用向量运算的符号图方法，使得新网络的指定变得至关容易，但TensorFlow

并不支持双向RNN和3D卷积，同时公共版本的图定义也不支持循环和条件控制，这使得RNN的实现并不理想，由于必需要使用Python循环且

没法进行图编译优化。

2）支持python和c++接口。

3）因为它使用了Eigen而不是BLAS类库，因此可以基于ARM架构编译和优化。用户能够将训练好的模型部署到多种设备上面，不须要实现单独的

模型解码器或者加载python/LuaJIT解释器。他的模型能够部署到Windows设备上。

4）架构清晰，采用模块化设计，支持多种前端和执行平台

Theano:

1）支持大部分的先进网络，如今不少研究想法都源于Theano，他引领了符号图在编程网络中使用的趋势，Theano的符号API支持循环控制，让

RNN实现更加容易且高效。

2）支持python接口

3）缺乏底层接口，而且其python解释器也很低效，对工业用户而言缺乏吸引力。跨平台，模型可以部署到Windows环境上。

4）架构变态，整个代码库都是Python的，就来你C/cuda代码也要被打包为Python字符串，这使得它难以导航、调试、重构和维护。

Torch:

1）对卷积网络的支持很是好。TensorFlow和Theano中时域卷积能够经过conv2d来实现，但这样作有点取巧；

2）在luaJIT上运行，与c++\c#以及JAVA比较，速度至关快，性能更好，可是Lua不是主流的语言。

3）须要LuaJIT的支持，集成方面难度大，使得他的吸引力不如Caffe\CNTK\TensorFlow等直接支持C++框架。

Caffe、CNTK、TensorFlow和Theano都在全部的系统上运行，而Torch不支持Windows。