TensorFlow layers模块用法

时间 2021-01-24

标签 python git github api 网络 app ide 函数学习 spa 栏目 Python 繁體版

原文原文链接

TensorFlow 中的 layers 模块提供用于深度学习的更高层次封装的 API，利用它咱们能够轻松地构建模型，这一节咱们就来看下这个模块的 API 的具体用法。python

概览

layers 模块的路径写法为 tf.layers，这个模块定义在 tensorflow/python/layers/layers.py，其官方文档地址为：https://www.tensorflow.org/api_docs/python/tf/layers，TensorFlow 版本为 1.5。git

这里面提供了多个类和方法以供使用，下面咱们分别予以介绍。github

方法

tf.layers 模块提供的方法有：api

Input(…): 用于实例化一个输入 Tensor，做为神经网络的输入。网络
average_pooling1d(…): 一维平均池化层app
average_pooling2d(…): 二维平均池化层ide
average_pooling3d(…): 三维平均池化层函数
batch_normalization(…): 批量标准化层学习
conv1d(…): 一维卷积层spa
conv2d(…): 二维卷积层
conv2d_transpose(…): 二维反卷积层
conv3d(…): 三维卷积层
conv3d_transpose(…): 三维反卷积层
dense(…): 全链接层
dropout(…): Dropout层
flatten(…): Flatten层，即把一个 Tensor 展平
max_pooling1d(…): 一维最大池化层
max_pooling2d(…): 二维最大池化层
max_pooling3d(…): 三维最大池化层
separable_conv2d(…): 二维深度可分离卷积层

Input

tf.layers.Input() 这个方法是用于输入数据的方法，其实相似于 tf.placeholder，至关于一个占位符的做用，固然也能够经过传入 tensor 参数来进行赋值。

Input(
    shape=None,
    batch_size=None,
    name=None,
    dtype=tf.float32,
    sparse=False,
    tensor=None
)

参数说明以下：

shape：可选，默认 None，是一个数字组成的元组或列表，可是这个 shape 比较特殊，它不包含 batch_size，好比传入的 shape 为 [32]，那么它会将 shape 转化为 [?, 32]，这里必定须要注意。
batch_size：可选，默认 None，表明输入数据的 batch size，能够是数字或者 None。
name：可选，默认 None，输入层的名称。
dtype：可选，默认 tf.float32，元素的类型。
sparse：可选，默认 False，指定是否以稀疏矩阵的形式来建立 placeholder。
tensor：可选，默认 None，若是指定，那么建立的内容便再也不是一个 placeholder，会用此 Tensor 初始化。

返回值：
返回一个包含历史 Meta Data 的 Tensor。

咱们用一个实例来感觉一下：

x = tf.layers.Input(shape=[32])
print(x)
y = tf.layers.dense(x, 16, activation=tf.nn.softmax)
print(y)

首先咱们用 Input() 方法初始化了一个 placeholder，这时咱们没有传入 tensor 参数，而后调用了 dense() 方法构建了一个全链接网络，激活函数使用 softmax，而后将两者输出，结果以下：

Tensor("input_layer_1:0", shape=(?, 32), dtype=float32)
Tensor("dense/Softmax:0", shape=(?, 16), dtype=float32)

这时咱们发现，shape 它给咱们作了转化，原本是 [32]，结果它给转化成了 [?, 32]，即第一维表明 batch_size，因此咱们须要注意，在调用此方法的时候不须要去关心 batch_size 这一维。

若是咱们在初始化的时候传入一个已有 Tensor，例如：

data = tf.constant([1, 2, 3])
x = tf.layers.Input(tensor=data)
print(x)

结果以下：

Tensor("Const:0", shape=(3,), dtype=int32)

能够看到它能够自动计算出其 shape 和 dtype。

batch_normalization

此方法是批量标准化的方法，通过处理以后能够加速训练速度，其定义在 tensorflow/python/layers/normalization.py，论文能够参考：http://arxiv.org/abs/1502.03167"Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift"。

batch_normalization(
    inputs,
    axis=-1,
    momentum=0.99,
    epsilon=0.001,
    center=True,
    scale=True,
    beta_initializer=tf.zeros_initializer(),
    gamma_initializer=tf.ones_initializer(),
    moving_mean_initializer=tf.zeros_initializer(),
    moving_variance_initializer=tf.ones_initializer(),
    beta_regularizer=None,
    gamma_regularizer=None,
    beta_constraint=None,
    gamma_constraint=None,
    training=False,
    trainable=True,
    name=None,
    reuse=None,
    renorm=False,
    renorm_clipping=None,
    renorm_momentum=0.99,
    fused=None,
    virtual_batch_size=None,
    adjustment=None
)

参数说明以下：

inputs：必需，即输入数据。
axis：可选，默认 -1，即进行标注化操做时操做数据的哪一个维度。
momentum：可选，默认 0.99，即动态均值的动量。
epsilon：可选，默认 0.01，大于0的小浮点数，用于防止除0错误。
center：可选，默认 True，若设为True，将会将 beta 做为偏置加上去，不然忽略参数 beta
scale：可选，默认 True，若设为True，则会乘以gamma，不然不使用gamma。当下一层是线性的时，能够设False，由于scaling的操做将被下一层执行。
beta_initializer：可选，默认 zeros_initializer，即 beta 权重的初始方法。
gamma_initializer：可选，默认 ones_initializer，即 gamma 的初始化方法。
moving_mean_initializer：可选，默认 zeros_initializer，即动态均值的初始化方法。
moving_variance_initializer：可选，默认 ones_initializer，即动态方差的初始化方法。
beta_regularizer: 可选，默认None，beta 的正则化方法。
gamma_regularizer: 可选，默认None，gamma 的正则化方法。
beta_constraint: 可选，默认None，加在 beta 上的约束项。
gamma_constraint: 可选，默认None，加在 gamma 上的约束项。
training：可选，默认 False，返回结果是 training 模式。
trainable：可选，默认为 True，布尔类型，若是为 True，则将变量添加 GraphKeys.TRAINABLE_VARIABLES 中。
name：可选，默认 None，层名称。
reuse：可选，默认 None，根据层名判断是否重复利用。
renorm：可选，默认 False，是否要用 Batch Renormalization (https://arxiv.org/abs/1702.03275)
renorm_clipping：可选，默认 None，是否要用 rmax、rmin、dmax 来 scalar Tensor。
renorm_momentum，可选，默认 0.99，用来更新动态均值和标准差的 Momentum 值。
fused，可选，默认 None，是否使用一个更快的、融合的实现方法。
virtual_batch_size，可选，默认 None，是一个 int 数字，指定一个虚拟 batch size。
adjustment，可选，默认 None，对标准化后的结果进行适当调整的方法。

最后的一些参数说明不够详尽，更详细的用法参考：https://www.tensorflow.org/api_docs/python/tf/layers/batch_normalization。

其用法很简单，在输入数据后面加一层 batch_normalization() 便可：

x = tf.layers.Input(shape=[32])
x = tf.layers.batch_normalization(x)
y = tf.layers.dense(x, 20)

dense

dense，即全链接网络，layers 模块提供了一个 dense() 方法来实现此操做，定义在 tensorflow/python/layers/core.py 中，下面咱们来讲明一下它的用法。

dense(
    inputs,
    units,
    activation=None,
    use_bias=True,
    kernel_initializer=None,
    bias_initializer=tf.zeros_initializer(),
    kernel_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    bias_constraint=None,
    trainable=True,
    name=None,
    reuse=None
)

参数说明以下：

inputs：必需，即须要进行操做的输入数据。
units：必须，即神经元的数量。
activation：可选，默认为 None，若是为 None 则是线性激活。
use_bias：可选，默认为 True，是否使用偏置。
kernel_initializer：可选，默认为 None，即权重的初始化方法，若是为 None，则使用默认的 Xavier 初始化方法。
bias_initializer：可选，默认为零值初始化，即偏置的初始化方法。
kernel_regularizer：可选，默认为 None，施加在权重上的正则项。
bias_regularizer：可选，默认为 None，施加在偏置上的正则项。
activity_regularizer：可选，默认为 None，施加在输出上的正则项。
kernel_constraint，可选，默认为 None，施加在权重上的约束项。
bias_constraint，可选，默认为 None，施加在偏置上的约束项。
trainable：可选，默认为 True，布尔类型，若是为 True，则将变量添加到 GraphKeys.TRAINABLE_VARIABLES 中。
name：可选，默认为 None，卷积层的名称。
reuse：可选，默认为 None，布尔类型，若是为 True，那么若是 name 相同时，会重复利用。

返回值：
全链接网络处理后的 Tensor。

下面咱们用一个实例来感觉一下它的用法：

x = tf.layers.Input(shape=[32])
print(x)
y1 = tf.layers.dense(x, 16, activation=tf.nn.relu)
print(y1)
y2 = tf.layers.dense(y1, 5, activation=tf.nn.sigmoid)
print(y2)

首先咱们用 Input 定义了 [?, 32] 的输入数据，而后通过第一层全链接网络，此时指定了神经元个数为 16，激活函数为 relu，接着输出结果通过第二层全链接网络，此时指定了神经元个数为 5，激活函数为 sigmoid，最后输出，结果以下：

Tensor("input_layer_1:0", shape=(?, 32), dtype=float32)
Tensor("dense/Relu:0", shape=(?, 16), dtype=float32)
Tensor("dense_2/Sigmoid:0", shape=(?, 5), dtype=float32)

能够看到输出结果的最后一维度就等于神经元的个数，这是很是容易理解的。

convolution

convolution，即卷积，这里提供了多个卷积方法，如 conv1d()、conv2d()、conv3d()，分别表明一维、二维、三维卷积，另外还有 conv2d_transpose()、conv3d_transpose()，分别表明二维和三维反卷积，还有 separable_conv2d() 方法表明二维深度可分离卷积。它们定义在 tensorflow/python/layers/convolutional.py 中，其用法都是相似的，在这里以 conv2d() 方法为例进行说明。

conv2d(
    inputs,
    filters,
    kernel_size,
    strides=(1, 1),
    padding='valid',
    data_format='channels_last',
    dilation_rate=(1, 1),
    activation=None,
    use_bias=True,
    kernel_initializer=None,
    bias_initializer=tf.zeros_initializer(),
    kernel_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    bias_constraint=None,
    trainable=True,
    name=None,
    reuse=None
)

参数说明以下：

inputs：必需，即须要进行操做的输入数据。
filters：必需，是一个数字，表明了输出通道的个数，即 output_channels。
kernel_size：必需，卷积核大小，必须是一个数字（高和宽都是此数字）或者长度为 2 的列表（分别表明高、宽）。
strides：可选，默认为 (1, 1)，卷积步长，必须是一个数字（高和宽都是此数字）或者长度为 2 的列表（分别表明高、宽）。
padding：可选，默认为 valid，padding 的模式，有 valid 和 same 两种，大小写不区分。
data_format：可选，默认 channels_last，分为 channels_last 和 channels_first 两种模式，表明了输入数据的维度类型，若是是 channels_last，那么输入数据的 shape 为 (batch, height, width, channels)，若是是 channels_first，那么输入数据的 shape 为 (batch, channels, height, width)。
dilation_rate：可选，默认为 (1, 1)，卷积的扩张率，如当扩张率为 2 时，卷积核内部就会有边距，3x3 的卷积核就会变成 5x5。
activation：可选，默认为 None，若是为 None 则是线性激活。
use_bias：可选，默认为 True，是否使用偏置。
kernel_initializer：可选，默认为 None，即权重的初始化方法，若是为 None，则使用默认的 Xavier 初始化方法。
bias_initializer：可选，默认为零值初始化，即偏置的初始化方法。
kernel_regularizer：可选，默认为 None，施加在权重上的正则项。
bias_regularizer：可选，默认为 None，施加在偏置上的正则项。
activity_regularizer：可选，默认为 None，施加在输出上的正则项。
kernel_constraint，可选，默认为 None，施加在权重上的约束项。
bias_constraint，可选，默认为 None，施加在偏置上的约束项。
trainable：可选，默认为 True，布尔类型，若是为 True，则将变量添加到 GraphKeys.TRAINABLE_VARIABLES 中。
name：可选，默认为 None，卷积层的名称。
reuse：可选，默认为 None，布尔类型，若是为 True，那么若是 name 相同时，会重复利用。

返回值：
卷积后的 Tensor。

下面咱们用实例感觉一下它的用法：

x = tf.layers.Input(shape=[20, 20, 3])
y = tf.layers.conv2d(x, filters=6, kernel_size=2, padding='same')
print(y)

这里咱们首先声明了一个 [?, 20, 20, 3] 的输入 x，而后将其传给 conv2d() 方法，filters 设定为 6，即输出通道为 6，kernel_size 为 2，即卷积核大小为 2 x 2，padding 方式设置为 same，那么输出结果的宽高和原来必定是相同的，可是输出通道就变成了 6，结果以下：

Tensor("conv2d/BiasAdd:0", shape=(?, 20, 20, 6), dtype=float32)

但若是咱们将 padding 方式不传入，使用默认的 valid 模式，代码改写以下：

x = tf.layers.Input(shape=[20, 20, 3])
y = tf.layers.conv2d(x, filters=6, kernel_size=2)
print(y)

结果以下：

Tensor("conv2d/BiasAdd:0", shape=(?, 19, 19, 6), dtype=float32)

结果就变成了 [?, 19, 19, 6]，这是由于步长默认为 1，卷积核大小为 2 x 2，因此获得的结果的高宽即为 (20 - (2 - 1)) x (20 - (2 - 1)) = 19 x 19。

固然卷积核咱们也能够变换大小，传入一个列表形式：

x = tf.layers.Input(shape=[20, 20, 3])
y = tf.layers.conv2d(x, filters=6, kernel_size=[2, 3])
print(y)

这时咱们的卷积核大小变成了 2 x 3，即高为 2，宽为 3，结果就变成了 [?, 19, 18, 6]，这是由于步长默认为 1，卷积核大小为 2 x 2，因此获得的结果的高宽即为 (20 - (2 - 1)) x (20 - (3 - 1)) = 19 x 18。

若是咱们将步长也设置一下，也传入列表形式：

x = tf.layers.Input(shape=[20, 20, 3])
y = tf.layers.conv2d(x, filters=6, kernel_size=[2, 3], strides=[2, 2])
print(y)

这时卷积核大小变成了 2 x 3，步长变成了 2 x 2，因此结果的高宽为 ceil(20 - (2- 1)) / 2 x ceil(20 - (3- 1)) / 2 = 10 x 9，获得的结果即为 [?, 10, 9, 6]。

运行结果以下：

Tensor("conv2d_4/BiasAdd:0", shape=(?, 10, 9, 6), dtype=float32)

另外咱们还能够传入激活函数，或者禁用 bias 等操做，实例以下：

x = tf.layers.Input(shape=[20, 20, 3])
y = tf.layers.conv2d(x, filters=6, kernel_size=2, activation=tf.nn.relu, use_bias=False)
print(y)

这样咱们就将激活函数改为了 relu，同时禁用了 bias，运行结果以下：

Tensor("conv2d_5/Relu:0", shape=(?, 19, 19, 6), dtype=float32)

另外还有反卷积操做，反卷积顾名思义即卷积的反向操做，即输入卷积的结果，获得卷积前的结果，其参数用法是彻底同样的，例如：

x = tf.layers.Input(shape=[20, 20, 3])
y = tf.layers.conv2d_transpose(x, filters=6, kernel_size=2, strides=2)
print(y)

例如此处输入的图像高宽为 20 x 20，通过卷积核为 2，步长为 2 的反卷积处理，获得的结果高宽就变为了 40 x 40，结果以下：

Tensor("conv2d_transpose/BiasAdd:0", shape=(?, 40, 40, 6), dtype=float32)

pooling

pooling，即池化，layers 模块提供了多个池化方法，这几个池化方法都是相似的，包括 max_pooling1d()、max_pooling2d()、max_pooling3d()、average_pooling1d()、average_pooling2d()、average_pooling3d()，分别表明一维二维三维最大和平均池化方法，它们都定义在 tensorflow/python/layers/pooling.py 中，这里以 max_pooling2d() 方法为例进行介绍。

max_pooling2d(
    inputs,
    pool_size,
    strides,
    padding='valid',
    data_format='channels_last',
    name=None
)

参数说明以下：

inputs: 必需，即须要池化的输入对象，必须是 4 维的。
pool_size：必需，池化窗口大小，必须是一个数字（高和宽都是此数字）或者长度为 2 的列表（分别表明高、宽）。
strides：必需，池化步长，必须是一个数字（高和宽都是此数字）或者长度为 2 的列表（分别表明高、宽）。
padding：可选，默认 valid，padding 的方法，valid 或者 same，大小写不区分。
data_format：可选，默认 channels_last，分为 channels_last 和 channels_first 两种模式，表明了输入数据的维度类型，若是是 channels_last，那么输入数据的 shape 为 (batch, height, width, channels)，若是是 channels_first，那么输入数据的 shape 为 (batch, channels, height, width)。
name：可选，默认 None，池化层的名称。

返回值：
通过池化处理后的 Tensor。

下面咱们用一个实例来感觉一下：

x = tf.layers.Input(shape=[20, 20, 3])
print(x)
y = tf.layers.conv2d(x, filters=6, kernel_size=3, padding='same')
print(y)
p = tf.layers.max_pooling2d(y, pool_size=2, strides=2)
print(p)

在这里咱们首先指定了输入 x，shape 为 [20, 20, 3]，而后对其进行了卷积计算，而后池化，最后获得池化后的结果。结果以下：

Tensor("input_layer_1:0", shape=(?, 20, 20, 3), dtype=float32)
Tensor("conv2d/BiasAdd:0", shape=(?, 20, 20, 6), dtype=float32)
Tensor("max_pooling2d/MaxPool:0", shape=(?, 10, 10, 6), dtype=float32)

能够看到这里池化窗口用的是 2，步长也是 2，因此本来卷积后 shape 为 [?, 20, 20, 6] 的结果就变成了 [?, 10, 10, 6]。

dropout

dropout 是指在深度学习网络的训练过程当中，对于神经网络单元，按照必定的几率将其暂时从网络中丢弃，能够用来防止过拟合，layers 模块中提供了 dropout() 方法来实现这一操做，定义在 tensorflow/python/layers/core.py。下面咱们来讲明一下它的用法。

dropout(
    inputs,
    rate=0.5,
    noise_shape=None,
    seed=None,
    training=False,
    name=None
)

参数说明以下：

inputs：必须，即输入数据。
rate：可选，默认为 0.5，即 dropout rate，如设置为 0.1，则意味着会丢弃 10% 的神经元。
noise_shape：可选，默认为 None，int32 类型的一维 Tensor，它表明了 dropout mask 的 shape，dropout mask 会与 inputs 相乘对 inputs 作转换，例如 inputs 的 shape 为 (batch_size, timesteps, features)，但咱们想要 droput mask 在全部 timesteps 都是相同的，咱们能够设置 noise_shape=[batch_size, 1, features]。
seed：可选，默认为 None，即产生随机熟的种子值。
training：可选，默认为 False，布尔类型，即表明了是否标志为 training 模式。
name：可选，默认为 None，dropout 层的名称。

返回：
通过 dropout 层以后的 Tensor。

咱们用一个实例来感觉一下：

x = tf.layers.Input(shape=[32])
print(x)
y = tf.layers.dense(x, 16, activation=tf.nn.softmax)
print(y)
d = tf.layers.dropout(y, rate=0.2)
print(d)

运行结果：

Tensor("input_layer_1:0", shape=(?, 32), dtype=float32)
Tensor("dense/Softmax:0", shape=(?, 16), dtype=float32)
Tensor("dropout/Identity:0", shape=(?, 16), dtype=float32)

在这里咱们使用 dropout() 方法实现了 droput 操做，并制定 dropout rate 为 0.2，最后输出结果的 shape 和原来是一致的。

flatten

flatten() 方法能够对 Tensor 进行展平操做，定义在 tensorflow/python/layers/core.py。

flatten(
    inputs,
    name=None
)

参数说明以下：

inputs：必需，即输入数据。
name：可选，默认为 None，即该层的名称。

返回结果：
展平后的 Tensor。

下面咱们用一个实例来感觉一下：

x = tf.layers.Input(shape=[5, 6])
print(x)
y = tf.layers.flatten(x)
print(y)

运行结果：

Tensor("input_layer_1:0", shape=(?, 5, 6), dtype=float32)
Tensor("flatten/Reshape:0", shape=(?, 30), dtype=float32)

这里输入数据的 shape 为 [?, 5, 6]，通过 flatten 层以后，就会变成 [?, 30]，即将除了第一维的数据维度相乘，对原 Tensor 进行展平。

假如第一维是一个已知的数的话，它依然仍是一样的处理，示例以下：

x = tf.placeholder(shape=[5, 6, 2], dtype=tf.float32)
print(x)
y = tf.layers.flatten(x)
print(y)

结果以下：

Tensor("Placeholder:0", shape=(5, 6, 2), dtype=float32)
Tensor("flatten_2/Reshape:0", shape=(5, 12), dtype=float32)

类

除了如上的方法，其实咱们还能够直接使用类来进行操做，实际上看方法的实现就是实例化了其对应的类，下面咱们首先说明一下有哪些类可使用：

class AveragePooling1D: 一维平均池化层类
class AveragePooling2D: 二维平均池化层类
class AveragePooling3D: 三维平均池化层类
class BatchNormalization: 批量标准化层类
class Conv1D: 一维卷积层类
class Conv2D: 二维卷积层类
class Conv2DTranspose: 二维反卷积层类
class Conv3D: 三维卷积层类
class Conv3DTranspose: 三维反卷积层类
class Dense: 全链接层类
class Dropout: Dropout 层类
class Flatten: Flatten 层类
class InputSpec: Input 层类
class Layer: 基类、父类
class MaxPooling1D: 一维最大池化层类
class MaxPooling2D: 二维最大池化层类
class MaxPooling3D: 三维最大池化层类
class SeparableConv2D: 二维深度可分离卷积层类

其实类这些类都和上文介绍的方法是一一对应的，关于它的用法咱们能够在方法的源码实现里面找到，下面咱们以 Dense 类的用法为例来讲明一下这些类的具体调用方法：

x = tf.layers.Input(shape=[32])
dense = tf.layers.Dense(16, activation=tf.nn.relu)
y = dense.apply(x)
print(y)

这里咱们初始化了一个 Dense 类，它只接受一个必须参数，那就是 units，相比 dense() 方法来讲它没有了 inputs，所以这个实例化的类和 inputs 是无关的，这样就至关于建立了一个 16 个神经元的全链接层。

但建立了不调用是没有用的，咱们要将这个层构建到网络之中，须要调用它的 apply() 方法，而 apply() 方法就接收 inputs 这个参数，返回计算结果，运行结果以下：

Tensor("dense/Relu:0", shape=(?, 16), dtype=float32)

所以咱们能够发现，这些类在初始化的时候其实是比其对应的方法少了 inputs 参数，其余的参数都是彻底一致的，另外须要调用 apply() 方法才能够应用该层并将其构建到模型中。

因此其余的类的用法在此就不一一赘述了，初始化的参数能够类比其对应的方法，实例化类以后，调用 apply() 方法，能够达到一样的构建模型的效果。

结语

以上即是 TensorFlow layers 模块的详细用法说明，更加详细的用法能够参考官方文档：https://www.tensorflow.org/api_docs/python/tf/layers。本节代码地址：https://github.com/AIDeepLearning/TensorFlowLayers。