对于分类方面,softmax函数的做用是从样本值计算获得该样本属于各个类别的几率大小。例如手写数字识别,softmax模型从给定的手写体图片像素值得出这张图片为数字0~9的几率值,这些几率值之和为1。预测的结果取最大的几率表示的数字做为这张图片的分类。
html
首先从tensorflow导入mnist数据集,里面包含了手写数字图片的像素矩阵,以及这些图片所对应的数字类别:编程
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
说明一下图片的像素矩阵是将28x28压平为[1x784]大小的向量;标签是[1x10]的向量,其中某一个数是1,其他全为0,好比说若是标签表示的是数字5,那么这个标签向量为[0,0,0,0,1,0,0,0,0,0]。
构建模型:网络
x = tf.placeholder("float",[None,784]) #一个二维向量的占位符,None表示第一位能够是任意长度,784表示一张图片压平后的长度 W = tf.Variable(tf.zeros([784,10])) b = tf.Variable(tf.zeros([10])) #temp = x*W + b #softmax(temp)获得一个[None,10]的向量,表示None个图片可能表明0~9的几率。 y = tf.nn.softmax(tf.matmul(x,W)+b)
构建模型训练过程:定义损失函数,最小化这个损失函数,从而获得W,b函数
y_ = tf.placeholder("float",[None,10]) #这里用占位符来表明y_(每一个图片的真实类别),后面运行时会将真实类别填给占位符。 cross_entropy = -tf.reduce_sum(y_*tf.log(y)) #y是模型的预测类别,y_是真实类别,用交叉熵来表明损失函数(说明预测值和真实值之间的差别) train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy) #用梯度降低法来最小化损失函数
运行以前构造的模型:学习
init = tf.initialize_all_variables()#init表示初始化全部变量 sess = tf.Session()#启动会话,用于运行模型 sess.run(init)#运行init才真正的使全部变量初始化 for i in range(1000):#训练模型1000遍 batch_xs,batch_ys = mnist.train.next_batch(100) #从数据集中取出100个样本 sess.run(train_step, feed_dict={x:batch_xs, y_:batch_ys}) #将样本填入以前定义的占位符,而后运行刚才构建的训练过程
评估模型:测试
correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(y_,1)) #逐个判断预测值和真实值是否相等,返回一个矩阵。 accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float")) #tf.cast将bool型转化为float型,reduce_mean计算平均值(即正确率) print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_: mnist.test.labels})) #将测试集填入以前的占位符,运行以前的模型,获得正确率
输出结果为:
0.9181
spa
tensorflow让用户先从更大的层面上构建模型,其中须要的数据先由占位符代替,而后在运行模型时再填入对应的数据。用户不须要对具体运算过程一步步编程实现,使得神经网络的构建简便了许多。
正在学习tensorflows时写的笔记,欢迎评论探讨!
code
参考网址:tensorflow中文社区htm