使用python+keras来识别狗的品种

时间 2021-01-07

标签 html python web 算法 flask 数组网络 app 框架机器学习栏目 Python 繁體版

原文原文链接

在这篇文章中，将教你们实现一个网页应用程序，该程序能够接收狗的图片，而后输出其品种，其准确率超过80%！

咱们将使用深度学习来训练一个识别狗品种的模型，数据集是狗图像与他们的品种信息，经过学习图像的特征来区分狗的品种。
数据分析
数据集能够从这里下载（https://s3-us-west-1.amazonaws.com/udacity-aind/dog-project/dogImages.zip）。如下是关于数据的一些介绍：html

犬种总数：133
狗图片总数：8351（训练集：6680，验证集：835，测试集：836）
最受欢迎的品种：阿拉斯加对应96个样本，博德牧羊犬对应93个样本
按图片数量排序的前30个品种以下：

咱们还能够在这里看到一些狗的图片和它们的品种：

数据预处理
咱们会把每一个图像做为一个numpy数组进行加载，并将它们的大小调整为224x224，这是大多数传统神经网络接受图像的默认大小，另外咱们为图像的数量添加为另外一个维度。

from keras.preprocessing import image
from tqdm import tqdmpython

def path_to_tensor(img_path):
'''将给定路径下的图像转换为张量'''
img = image.load_img(img_path, target_size=(224, 224))
x = image.img_to_array(img)
return np.expand_dims(x, axis=0)web

def paths_to_tensor(img_paths):
'''将给定路径中的全部图像转换为张量'''
list_of_tensors = [path_to_tensor(img_path) for img_path in tqdm(img_paths)]
return np.vstack(list_of_tensors)算法

最后，咱们使用ImageDataGenerator对图像进行动态缩放和加强

train_datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255,
horizontal_flip=True,
vertical_flip=True,
rotation_range=20)flask

valid_datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255.)数组

test_datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255.)网络

train_generator = train_datagen.flow(train_tensors, train_targets, batch_size=32)
valid_generator = train_datagen.flow(valid_tensors, valid_targets, batch_size=32)
test_generator = train_datagen.flow(test_tensors, test_targets, batch_size=32)
CNNapp

咱们将在预处理数据集上从头开始训练卷积神经网络（CNN），以下所示：

model = tf.keras.models.Sequential([
tf.keras.layers.Conv2D(16, (3,3), activation='relu', input_shape=(224, 224, 3)),
tf.keras.layers.MaxPooling2D(2, 2),
tf.keras.layers.Conv2D(32, (3,3), activation='relu'),
tf.keras.layers.MaxPooling2D(2,2),
tf.keras.layers.Conv2D(64, (3,3), activation='relu'),
tf.keras.layers.MaxPooling2D(2,2),
tf.keras.layers.Conv2D(128, (3,3), activation='relu'),
tf.keras.layers.MaxPooling2D(2,2),
tf.keras.layers.Conv2D(256, (3,3), activation='relu'),
tf.keras.layers.MaxPooling2D(2,2),
tf.keras.layers.Flatten(),
tf.keras.layers.Dense(2048, activation='softmax'),
tf.keras.layers.Dropout(0.5),
tf.keras.layers.Dense(1024, activation='softmax'),
tf.keras.layers.Dropout(0.5),
tf.keras.layers.Dense(133, activation='softmax')
])框架

model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])机器学习

checkpointer = tf.keras.callbacks.ModelCheckpoint(filepath='../saved_models/weights_best_custom.hdf5',
verbose=1, save_best_only=True)

model.fit(train_generator, epochs=5, validation_data=valid_generator, callbacks=[checkpointer])

咱们使用一个ModelCheckpoint的回调来保存验证分数较高的模型。经过测试模型，咱们获得的准确率只有1%左右
**使用迁移学习**
如今，咱们使用迁移学习来实现更高的准确率。首先咱们下载ResNet-50，能够经过运行下面的代码来提取相应的训练集、测试和验证集：

bottleneck_features = np.load('Data/bottleneck_features/DogResnet50Data.npz')
train_Resnet50 = bottleneck_features['train']
valid_Resnet50 = bottleneck_features['valid']
test_Resnet50 = bottleneck_features['test']

咱们如今再次定义模型，并对提取的特征使用GlobalAveragePooling2D，它将一组特征平均为一个值。最后，若是验证损失在两个连续的epoch内没有增长，咱们使用额外的回调来下降学习率；若是验证损失在连续的5个epoch内没有增长，能够提早中止训练。

Resnet50_model = tf.keras.models.Sequential()
Resnet50_model.add(tf.keras.layers.GlobalAveragePooling2D(input_shape=train_Resnet50.shape[1:]))
Resnet50_model.add(tf.keras.layers.Dense(1024, activation='relu'))
Resnet50_model.add(tf.keras.layers.Dense(133, activation='softmax'))

Resnet50_model.compile(loss='categorical_crossentropy', optimizer='rmsprop', metrics=['accuracy'])

checkpointer = tf.keras.callbacks.ModelCheckpoint(filepath='saved_models/weights_best_Resnet50.hdf5',
verbose=1, save_best_only=True)
early_stopping = tf.keras.callbacks.EarlyStopping(patience=5, monitor='val_loss')

reduce_lr = tf.keras.callbacks.ReduceLROnPlateau(patience=2, monitor='val_loss')
Resnet50_model.fit(train_Resnet50, train_targets,
validation_data=(valid_Resnet50, valid_targets),
epochs=50, batch_size=20, callbacks=[checkpointer, early_stopping, reduce_lr], verbose=1)### 训练模型

最后在测试集上的准确率为82.65%，这与咱们白手起家训练的模型相比，是一个巨大的进步。
**构建web应用程序**
对于web应用程序，咱们首先编写了一个helper函数，该函数接受图像路径并返回品种。label_to_cat字典将每一个数字标签映射到它的狗品种。

def predict_breed(img_path):
'''预测给定图像的品种'''

提取特征

bottleneck_feature = extract_Resnet50(path_to_tensor(img_path))
bottleneck_feature = tf.keras.models.Sequential([
                        tf.keras.layers.GlobalAveragePooling2D(input_shape=bottleneck_feature.shape[1:])
                    ]).predict(bottleneck_feature).reshape(1, 1, 1, 2048)
# 得到预测向量
predicted_vector = Resnet50_model.predict(bottleneck_feature)
# 模型预测的犬种
return label_to_cat[np.argmax(predicted_vector)]

对于web应用程序，咱们将使用flaskweb框架来帮助咱们用最少的代码建立web应用程序。咱们定义一个接受图像的路由，并用狗的品种呈现一个输出模板

@app.route('/upload', methods=['POST','GET'])
def upload_file():
if request.method == 'GET':
return render_template('index.html')
else:
file = request.files['image']
full_name = os.path.join(UPLOAD_FOLDER, file.filename)
file.save(full_name)
dog_breed = dog_breed_classifier(full_name)
return render_template('predict.html', image_file_name = file.filename, label = dog_breed)

predict.html是分别显示图像及其犬种的模板。
**结论**
祝贺你！你已经成功地实现了一个狗品种分类器，而且能够准确地分辨出狗的品种。让咱们总结一下咱们在这里学到的知识：
1. 咱们对数据集进行了分析和预处理。机器学习算法须要单独的训练集、测试集和验证集来进行置信预测。
1. 咱们从零开始使用CNN，因为未能提取特征，因此表现不佳。
1. 而后咱们使用了迁移学习，准确度大大提升
1.  最后，咱们构建了一个Flask web应用程序来实现咱们的项目封装
咱们确实学到了不少东西，但你还能够尝试不少其余的事情。你能够在heroku上部署web应用程序，也能够尝试使用不一样的层（如Dropout层）来提升准确性。
参考连接：https://towardsdatascience.com/dont-know-the-breed-of-your-dog-ml-can-help-6558eb5f7f05