Tensorflow 2.0 datasets数据加载

导入包python

import tensorflow as tf
from tensorflow import keras

加载数据

tensorflow能够调用keras自带的datasets,很方便,就是有一点让人不爽的是下载须要fq,而这个代理不太方便开,因此这里我把全部数据都下载下来了,并上传到了坚果云,方便你们下载。shell

下载链接 (访问密码:yDmqHd)json

下载好以后,把输入放入C:\Users\用户名\.keras\datasets里面,若是没有datasets文件夹,就新建一个,而后直接把数据放里面就好了。代理

目录结构以下code

C:.
│  keras.json
│
└─datasets
    │  boston_housing.npz
    │  cifar-10-batches-py.tar.gz
    │  cifar-100-python.tar.gz
    │  imdb.npz
    │  mnist.npz
    │  reuters.npz
    │
    └─fashion-mnist
            t10k-images-idx3-ubyte.gz
            t10k-labels-idx1-ubyte.gz
            train-images-idx3-ubyte.gz
            train-labels-idx1-ubyte.gz

最后读入数据只需一句话ci

(x, y), (x_test, y_test) = keras.datasets.mnist.load_data()
(x, y), (x_test, y_test) = keras.datasets.boston_housing.load_data()
...

tf.data.Dataset使用

使用.from_tensor_slices方法进行加载数据集get

ds = tf.data.Dataset.from_tensor_slices((x, y))

数据预处理

.map

使用map能够对数据进行预测,和python自带原理同样io

def prepare_mnist_fea(x, y):
    x = tf.cast(x, tf.float32) / 255.0
    y = tf.cast(y, tf.float32)
    return x, y

ds.map(prepare_mnist_fea)

.shuffle

打乱顺序ast

ds.shuffle(10000)

.batch

使用某个batch进行迭代class

ds.batch(32)

.repeat

重复执行整个数据多少次,也就是epoch的意思

ds.repeat(10)
相关文章
相关标签/搜索