带你认识神奇的Gumbel trick

The Gumbel soft-max Gumbel trick有两个用途,一个用途是是用来对离散分布进行采样,这是一种重参数化(reparameterization trick)的技巧,另外一个用途是用于估计normalizing partition function,也就是分布的归一化项。本文将介绍这两种方法的原理。 下面是一个使用gumbel trick来模拟离散分布采样的例子: 如上图例子
相关文章
相关标签/搜索