论文-阅读翻译+笔记-深度玻尔兹曼机

我们提出了一种新的玻尔兹曼机器学习算法,其中包含许多隐藏变量层。依赖于数据的期望是使用趋于关注单一模式的变分近似来估计的,并且使用持续马尔可夫链来近似数据依赖期望。使用两种截然不同的技术来估计进入对数似然梯度的两种期望类型,使得学习具有多个隐藏层和数百万个参数的玻尔兹曼机器变得切实可行。 通过使用逐层“预训练”阶段,可以使得学习变得更有效率,从而允许使用单一自底向上通过初始化变量指数。我们在MNI
相关文章
相关标签/搜索