对 GAN 的 value function 的理解

 

 


上式分为两个步骤:网络

  • 第一步:调整discriminative model D的权重,使得V中两项取得最大值
  • 第二步:调整generative model G的权重,使得V中第二项取得最小值

首先,分析log D(x)的含义:blog

  • D(x)表示discriminative model D对一个原始样本的评分,评分越高,表示D越趋向于相信该样本是一个真实样本
  • D(G(z))表示discriminative model D对一个生成样本的评分,评分越高,表示D越趋向于把一个生成样本当成了一个真实样本

所以,网络训练过程总结以下:model

  • 第一步:训练D,使得上述两个指望最大
    • 第一项指望值最大,表示D将一个真实样本给出一个高的评分
    • 第二项指望值最大,表示D将一个生成样本给出一个低分
  • 第二步:训练G,使得指望值的第二项最小
    • 第二项指望值最小,即:找到一个G,使其生成的样本可以在discriminative model D中得到一个较高的评分

 

图:GAN的训练收敛过程im

蓝色表示D总结

绿色表示G数据

黑色表示原数据img


 

2019年8月18日di

于南湖畔co

相关文章
相关标签/搜索