基于keras平台CNN神经网络模型的服装识别分析

时间 2020-05-20

标签基于 keras 平台 cnn 神经网络模型服装识别分析繁體版

原文原文链接

原文连接：http://tecdat.cn/?p=8493

在许多介绍图像识别任务的介绍中，一般使用着名的MNIST数据集。可是，这些数据存在一些问题：git

1.太简单了。例如，一个简单的MLP模型能够达到99％的准确度，而一个2层CNN能够达到99％的准确度。github

2.它被过分使用。从字面上看，每台机器学习入门文章或图像识别任务都将使用此数据集做为基准。可是，由于得到近乎完美的分类结果很是容易，因此它的实用性会受到打折，而且对于现代机器学习/ AI任务并不真正有用。后端

所以，出现Fashion-MNIST数据集。该数据集是做为MNIST数据的直接替代而开发的，其意义在于：网络

1.尺寸和风格相同：28x28灰度图像框架

2.每一个图像与10个类中的1个相关联，即：机器学习

0：T恤/上衣，工具

1：裤子，学习

2：套头衫，测试

3：连衣裙，spa

4 ：外套，

5：凉鞋，

6：衬衫，

7：运动鞋，

8：背包，

9：脚靴

3. 60000训练样本和10000个测试样本如下是一些样本的快照：

自从它出现以来，已经有多份提交文件来对这些数据进行基准测试，其中一些可以达到95％以上的准确度。

我也试图用keras来对这个数据进行基准测试。keras是构建深度学习模型的高级框架，在后端选择TensorFlow，Theano和CNTK。它很容易安装和使用。对于个人应用程序，我使用了CNTK后端。

在这里，我将以两个模型为基准。一种是层结构为256-512-100-10的MLP，另外一种是类VGG的CNN。

第一个模型在100个历元后的测试数据上达到了[0.89，0.90]的精度，然后者达到了45个时期后的测试数据的精度> 0.94。

咱们先用tSNE来看它。听说tSNE是最有效的尺寸缩小工具。

我使用了1000个样原本快速运行。若是您的PC速度足够快而且有时间，则能够针对完整数据集运行tSNE。

咱们看到，包括质量大小，底部分裂和对称性等几个特征将类别分开。

为了创建本身的网络，咱们首先导入一些库

该模型在大约100个时期的测试数据集上达到了近90％的准确度。如今，咱们来构建一个相似VGG的CNN模型。咱们使用相似于VGG的体系结构，但仍然很是不一样。因为图形数据很小，若是咱们使用原始VGG体系结构，它极可能会过分配合，而且在测试数据时表现不佳，这些数据在上面列出的公开提交的基准测试中观察到。在keras中构建这样一个模型是很是天然和容易的：

这个模型有150万个参数。咱们能够调用'fit'方法来训练模型：

model3_fit=model3.fit(X_train, Y_train2, validation_data = (X_test, Y_test2), epochs=50, verbose=1, batch_size=500)

通过40次之后，这个模型在测试数据上得到了0.94的精度。显然，这个模型也存在过分拟合问题。咱们稍后会解决这个问题。