自编码器及其相关模型

时间 2019-12-09

标签编码器及其相关模型繁體版

原文原文链接

　　自编码器是一种无监督的神经网络模型，其核心的做用是可以学习到输入数据的深层表示。网络

　　当前自编码器的主要应用有两个方面：一是特征提取；另外一个是非线性降维，用于高维数据的可视化，与流行学习关系密切。函数

自编码器（AutoEncoder，AE）：最原始的AE网络是一个三层的前馈神经网络结构，由输入层、隐藏层和输出层构成。学习

　　对于二值神经网络，也就是输入层的每一个神经元只能取值0或1，那么损失函数一般由交叉熵来定义；编码

　　对于输入神经元是一个任意实数，则永昌采用均方偏差来定义损失函数。spa

　　自编码器的核心设计是隐藏层，隐藏层的设计有两种方式：设计

　　1. 当隐藏层神经元个数小于输入层神经元个数时，称为undercomplete。该隐藏层设计使得输入层到隐藏层的变化本质上是一种降维的操做，网络试图以更小的维度去描述原始数据而尽可能不损失数据信息，从而获得输入层的压缩表示。当隐藏层的激活函数采用线性函数时，自编码器也称为线性自编码器，其效果等价于主成分分析。code

　　2. 当隐藏层神经元个数大于输入层神经元个数时，称为overcomplete。该隐藏层设计通常用于稀疏编码器，能够得到稀疏的特征表示，也就是隐藏层中有大量的神经元取值为0。blog

自编码器的相关模型：io

1. 降噪自编码器（Denoising Autoencoders，DAE）：其目的是加强自编码器的鲁棒性。自编码器的目标是指望重构后的结果输出与输入数据相同，也就是可以学习到输入层的正确数据分布。但当输入层数据受到噪音的影响时，可能会使得得到的输入数据自己就不服从原始的分布。在这种状况下，利用自编码器获得的结果也将是不正确的，为了解决这种因为噪音产生的数据误差问题，提出DAE网络结构。
可视化

2. 栈式自编码器（Stacked Autoencoders，SAE）：也称为堆栈自编码器、堆叠自编码器等。就是将多个自编码器进行叠加。利用上一层的隐藏层即是做为下一层的输入，获得更抽象的表示。

SAE的一个很重要的应用是经过逐层预训练来初始化网络权重参数，从而提高深层网络的收敛速度和减缓梯度消失的影响。

SAE经过下面两个阶段做用于整个网络。

阶段1：逐层预训练：是指用过自编码器来训练每一层的参数，做为神经网络的初始化参数。利用逐层预训练的方法，首先构建多个自编码器，每个自编码器对应于一个隐藏层。从左到右逐层训练每个自编码器，用训练后的最优参数做为神经网络的初始化参数。若是考虑到模型的鲁棒性，防止数据受噪音的影响，能够将AE变位DAE，这样由多个DAE叠加的栈式自编码器，也称为栈式降噪自编码器。

阶段2：微调：通过第一步的逐层预训练后，获得了网络权重参数更加合理的初始化估算，就能够像训练普通的深层网络同样，经过输出层的损失函数，利用梯度降低等方法来迭代求解最优参数。

3. 稀疏编码器：因为稀疏编码器可以学习到输入的数据的稀疏特征表示，所以当前被普遍应用于无监督的特征提取学习中。特色：隐藏层向量是稀疏的，尽量多的零元素。