TensorFlow实战Google深度学习框架10-12章学习笔记

时间 2019-11-06

标签 tensorflow 实战 google 深度学习框架笔记栏目 Google 繁體版

原文原文链接

目录算法

第10章 TensorFlow高层封装网络

第11章 TensorBoard可视化dom

第12章 TensorFlow计算加速异步

第10章 TensorFlow高层封装

目前比较流行的TensorFlow高层封装主要有4个，分别是TensorFlow-Slim、TFLearn、Keras和Estimator。分布式

TensorFlow-Slim是Google官方给出的相对较早的TensorFlow高层封装，Google经过TensorFlow-Slim开源了一些已经训练好的图像分析模型，因此目前在图像识别问题中TensorFlow-Slim仍被较多地使用。函数

与TesorFlow-Slim相比，TFLearn是一个更加简洁的TensorFlow高层封装。经过TFLearn能够更加容易地完成模型定义、模型训练以及模型评测的全过程。如下给出使用TFLearn在MNIST数据集上实现LeNet-5模型：工具

import tflearn
from tflearn.layers.core import input_data, dropout, fully_connected
from tflearn.layers.conv import conv_2d, max_pool_2d
from tflearn.layers.estimator import regression
import tflearn.datasets.mnist as mnist


trainX, trainY, testX, testY = mnist.load_data(
    data_dir="./MNIST_data", one_hot=True)
# 将图像数据resize成卷积卷积神经网络输入的格式。
trainX = trainX.reshape([-1, 28, 28, 1])
testX = testX.reshape([-1, 28, 28, 1])


# 构建神经网络。
net = input_data(shape=[None, 28, 28, 1], name='input')
net = conv_2d(net, 32, 5, activation='relu')
net = max_pool_2d(net, 2)
net = conv_2d(net, 64, 5, activation='relu')
net = max_pool_2d(net, 2)
net = fully_connected(net, 500, activation='relu')
net = fully_connected(net, 10, activation='softmax')

# 定义学习任务。指定优化器为sgd，学习率为0.01，损失函数为交叉熵。
net = regression(net, optimizer='sgd', learning_rate=0.01,
                 loss='categorical_crossentropy')
 
# 经过定义的网络结构训练模型，并在指定的验证数据上验证模型的效果。
model = tflearn.DNN(net, tensorboard_verbose=0)
model.fit(trainX, trainY, n_epoch=10,
          validation_set=([testX, testY]),
          show_metric=True)

运行结果：学习

Training Step: 8599  | total loss: 0.16579 | time: 29.478s
| SGD | epoch: 010 | loss: 0.16579 - acc: 0.9785 -- iter: 54976/55000
Training Step: 8600  | total loss: 0.14981 | time: 31.360s
| SGD | epoch: 010 | loss: 0.14981 - acc: 0.9806 | val_loss: 0.04016 - val_acc: 0.9857 -- iter: 55000/55000
--

Keras是目前使用最为普遍的深度学习工具之一，它的底层能够支持TensorFlow、MXNet、CNTK和Theano。Keras API训练模型能够先定义一个Sequential类，而后在Sequential实例中经过add函数添加网络层。Keras把卷积层、池化层、RNN结构(LSTM、GRN)、全链接层等经常使用的神经网络结构都作了封装，能够很方便地实现深层神经网络。优化

除了可以还跟方便地处理图像问题，Keras对于循环神经网络的支持也是很是出色。有了Keras API，循环神经网络的循环体结构也能够经过一句命令完成。原生态的Keras API对训练数据的处理流程支持得不太好，基本上须要一次性将数据所有加载到内存；其次，原生态Keras API没法支持分布式训练。为了解决这两个问题，Keras提供了一种与原生态TensorFlow结合得更加紧密得方式，如下代码显示了如何将Keras和原生态TensorFlow API联合起来解决MNIST问题。spa

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data


mnist_data = input_data.read_data_sets('./MNIST_data', one_hot=True)

# 经过TensorFlow中的placeholder定义输入。
x = tf.placeholder(tf.float32, shape=(None, 784))
y_ = tf.placeholder(tf.float32, shape=(None, 10))
 
net = tf.keras.layers.Dense(500, activation='relu')(x)
y = tf.keras.layers.Dense(10, activation='softmax')(net)
acc_value = tf.reduce_mean(
    tf.keras.metrics.categorical_accuracy(y_, y))

loss = tf.reduce_mean(tf.keras.losses.categorical_crossentropy(y_, y))
train_step = tf.train.GradientDescentOptimizer(0.5).minimize(loss)
 
with tf.Session() as sess:
    tf.global_variables_initializer().run()
    for i in range(3000):
        xs, ys = mnist_data.train.next_batch(100)
        _, loss_value = sess.run([train_step, loss], feed_dict={x: xs, y_: ys})
        if i % 1000 == 0:
            print("After %d training step(s), loss on training batch is "
                  "%g." % (i, loss_value))
 
    print (acc_value.eval(feed_dict={x: mnist_data.test.images,
                                    y_: mnist_data.test.labels}))

运行结果：

Extracting ./MNIST_data/train-images-idx3-ubyte.gz
Extracting ./MNIST_data/train-labels-idx1-ubyte.gz
Extracting ./MNIST_data/t10k-images-idx3-ubyte.gz
Extracting ./MNIST_data/t10k-labels-idx1-ubyte.gz
After 0 training step(s), loss on training batch is 2.3884.
After 1000 training step(s), loss on training batch is 0.0444334.
After 2000 training step(s), loss on training batch is 0.0692529.
0.9781

Estimator是TensorFlow官方提供的高层API，因此它更好地整合了原生态TensorFlow提供的功能。预先定义好的Estimator功能有限，好比没法很好地实现卷积神经网络或者循环神经网络，也没有办法支持自定义的损失函数，因此通常推荐使用Estimator自定义模型。除此以外，Estimator能够原生地支持TensorFlow中数据处理流程的接口。

第11章 TensorBoard可视化

TensorBoard是TensorFlow的可视化工具，它能够经过TensorFlow程序运行过程当中输出的日志文件可视化TensorFlow程序的运行状态。TensorBoard和TensorFlow程序跑在不一样的进程中，TensorBoard会自动读取最新的TensorFlow日志文件，并呈现当前TensorFlow程序运行的最新状态。如下代码示例完成TensorFlow日志输出功能：

import tensorflow as tf

input1 = tf.constant([1.0, 2.0, 3.0], name="input1")
input2 = tf.Variable(tf.random_uniform([3]), name="input2")
output = tf.add_n([input1, input2], name="add")
 
writer = tf.summary.FileWriter("./tf_log", tf.get_default_graph())
writer.close()

运行结果：

而后，使用TensorBoard进行可视化，运行如下命令：

tensorboard --logdir=./tf_log

为了更好地组织可视化效果图中的计算节点，TensorBoard支持经过TensorFlow命名空间来整理可视化效果图上的节点。变量的命名空间有tf.variable_scope和tf.name_scope函数。TensorBoard除了展现TensorFlow计算图的结构，还能够展现TensorFlow计算图上每一个节点的基本信息以及运行时消耗的时间和空间。

TensorBoard能够依据程序运行的过程对其相关的结果进行可视化，分别有SCALARS、IMAGES、AUDIO、TEXT、HISTOGRAMS和DISRIBUTIONS栏。下图是其中SCALARS栏对MNIST数据集进行训练的可视化结果：

TensorBoard提供了PROJECTOR界面来可视化高维向量之间的关系，PROJECTOR界面能够很是方便地可视化多个高维向量之间的关系。好比在图像迁移学习中能够将一组目标问题的图片经过训练好的卷积层获得瓶颈层，这些瓶颈层向量就是多个高维向量。若是在目标问题图像数据集上同一种类的图片在通过卷积层以后获得的瓶颈层向量在空间中比较接近，那么这样迁移学习获得的记过就有可能会更好。

第12章 TensorFlow计算加速

在配置好GPU环境的TensorFlow中，若是操做没有明确地指定运行设备，那么TensorFlow会优先选择GPU。不一样版本的TensorFlow对GPU的支持不同，若是程序中所有使用强制指定设备的方式会下降程序的可移植性。虽然GPU能够加速TensorFlow的计算，但通常来讲不会把全部的操做所有放在GPU上。一个比较好的实践是将计算密集型的运行放在GPU上，而把其余操做放到CPU上。

经常使用的并行化深度学习模型训练方式有两种，分别是同步模式和异步模式。在并行化地训练深度学习模型时，不一样设备（GPU或CPU）能够在不一样训练数据上运行这个迭代过程，而不一样并行模式的区别在于不一样的参数更新方式。

异步模式：在每一轮迭代时，不一样设备会读取参数最新的取值，但由于不一样设备读取参数取值的时间不同，因此获得的值也有可能不同。根据当前参数的取值和随机获取的一小部分训练数据，不一样设备各自运行反向传播的过程并独立地更新参数。能够简单地认为异步模式就是单机模式复制了多份，每一份使用不一样的训练数据进行训练。在异步模式下，不一样设备之间是彻底独立的。

同步模式：在同步模式下，全部的设备同时读取参数的取值，而且当反向传播算法完成以后同步更新参数的取值。单个设备不会单独对参数进行更新，而会等待全部设备都完成反向传播以后再同一更新参数。