参考文献 强烈推荐Tensorflow实战Google深度学习框架 实验平台: Tensorflow1.4.0 python3.5.0 MNIST数据集将四个文件下载后放到当前目录下的MNIST_data文件夹下python
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data import tqdm # #### 1. 生成变量监控信息并定义生成监控信息日志的操做。 SUMMARY_DIR = "log_1" BATCH_SIZE = 100 TRAIN_STEPS = 3000 # var给出了须要记录的张量,name给出了在可视化结果中显示的图表名称,这个名称通常和变量名一致 def variable_summaries(var, name): # 将生成监控信息的操做放在同一个命名空间下 with tf.name_scope('summaries'): # 经过tf.histogram_summary函数记录张量中元素的取值分布 # tf.summary.histogram函数会生成一个Summary protocol buffer. # 将Summary 写入TensorBoard 门志文件后,在HISTOGRAMS 栏,和 # DISTRIBUTION 栏下都会出现对应名称的图表。和TensorFlow 中其余操做相似, # tf.summary.histogram 函数不会马上被执行,只有当sess.run 函数明确调用这个操做时, TensorFlow # 才会具正生成并输出Summary protocol buffer. tf.summary.histogram(name, var) # 计算变量的平均值,并定义生成平均值信息日志的操做,记录变量平均值信息的日志标签名 # 为'mean/'+name,其中mean为命名空间,/是命名空间的分隔符 # 在相同命名空间中的监控指标会被整合到同一栏中,name则给出了当前监控指标属于哪个变量 mean = tf.reduce_mean(var) tf.summary.scalar('mean/' + name, mean) # 计算变量的标准差,并定义生成其日志文件的操做 stddev = tf.sqrt(tf.reduce_mean(tf.square(var - mean))) tf.summary.scalar('stddev/' + name, stddev) # #### 2. 生成一层全连接的神经网络。 def nn_layer(input_tensor, input_dim, output_dim, layer_name, act=tf.nn.relu): # 将同一层神经网络放在一个统一的命名空间下 with tf.name_scope(layer_name): # 声明神经网络边上的权值,并调用权重监控信息日志的函数 with tf.name_scope('weights'): weights = tf.Variable(tf.truncated_normal([input_dim, output_dim], stddev=0.1)) variable_summaries(weights, layer_name + '/weights') # 声明神经网络边上的偏置,并调用偏置监控信息日志的函数 with tf.name_scope('biases'): biases = tf.Variable(tf.constant(0.0, shape=[output_dim])) variable_summaries(biases, layer_name + '/biases') with tf.name_scope('Wx_plus_b'): preactivate = tf.matmul(input_tensor, weights) + biases # 记录神经网络节点输出在通过激活函数以前的分布 tf.summary.histogram(layer_name + '/pre_activations', preactivate) activations = act(preactivate, name='activation') # 记录神经网络节点输出在通过激活函数以后的分布。 """ 对于layerl ,由于使用了ReLU函数做为激活函数,因此全部小于0的值部被设为了0。因而在激活后 的layerl/activations 图上全部的值都是大于0的。而对于layer2 ,由于没有使用激活函数, 因此layer2/activations 和layer2/pre_activations 同样。 """ tf.summary.histogram(layer_name + '/activations', activations) return activations def main(): mnist = input_data.read_data_sets("./datasets/MNIST_data", one_hot=True) with tf.name_scope('input'): x = tf.placeholder(tf.float32, [None, 784], name='x-input') y_ = tf.placeholder(tf.float32, [None, 10], name='y-input') with tf.name_scope('input_reshape'): image_shaped_input = tf.reshape(x, [-1, 28, 28, 1]) tf.summary.image('input', image_shaped_input, 10) # 将输入变量还原成图片的像素矩阵,并经过tf.iamge_summary函数定义将当前的图片信息写入日志的操做 hidden1 = nn_layer(x, 784, 500, 'layer1') y = nn_layer(hidden1, 500, 10, 'layer2', act=tf.identity) # 计算交叉熵并定义生成交叉熵监控日志的操做。 with tf.name_scope('cross_entropy'): cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=y, labels=y_)) tf.summary.scalar('cross_entropy', cross_entropy) with tf.name_scope('train'): train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy) """ 计算模型在当前给定数据上的正确率,并定义生成正确率监控日志的操做。若是在sess.run() 时给定的数据是训练batch,那么获得的正确率就是在这个训练batch上的正确率;若是 给定的数据为验证或者测试数据,那么获得的正确率就是在当前模型在验证或者测试数据上 的正确率。 """ with tf.name_scope('accuracy'): with tf.name_scope('correct_prediction'): correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1)) with tf.name_scope('accuracy'): accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32)) tf.summary.scalar('accuracy', accuracy) # tf.scalar_summary,tf.histogram_summary,tf.image_summary函数都不会当即执行,须要经过sess.run来调用这些函数 # 由于程序重定义的写日志的操做很是多,一一调用很是麻烦,因此Tensorflow提供了tf.merge_all_summaries函数来整理全部的日志生成操做。 # 在Tensorflow程序执行的过程当中只须要运行这个操做就能够将代码中定义的全部日志生成操做所有执行一次,从而将全部日志文件写入文件。 merged = tf.summary.merge_all() with tf.Session() as sess: # 初始化写日志的writer,并将当前的Tensorflow计算图写入日志 summary_writer = tf.summary.FileWriter(SUMMARY_DIR, sess.graph) tf.global_variables_initializer().run() for i in tqdm.tqdm(range(TRAIN_STEPS)): xs, ys = mnist.train.next_batch(BATCH_SIZE) # 运行训练步骤以及全部的日志生成操做,获得此次运行的日志。 summary, _ = sess.run([merged, train_step], feed_dict={x: xs, y_: ys}) # 将获得的全部日志写入日志文件,这样TensorBoard程序就能够拿到此次运行所对应的 # 运行信息。 summary_writer.add_summary(summary, i) summary_writer.close() if __name__ == '__main__': main()