对 GAN 的 value function 的理解

上式分为两个步骤:网络
- 第一步:调整discriminative model D的权重,使得V中两项取得最大值
- 第二步:调整generative model G的权重,使得V中第二项取得最小值
首先,分析log D(x)的含义:blog
- D(x)表示discriminative model D对一个原始样本的评分,评分越高,表示D越趋向于相信该样本是一个真实样本
- D(G(z))表示discriminative model D对一个生成样本的评分,评分越高,表示D越趋向于把一个生成样本当成了一个真实样本
所以,网络训练过程总结以下:model
- 第一步:训练D,使得上述两个指望最大
- 第一项指望值最大,表示D将一个真实样本给出一个高的评分
- 第二项指望值最大,表示D将一个生成样本给出一个低分
第二步:训练G,使得指望值的第二项最小
- 第二项指望值最小,即:找到一个G,使其生成的样本可以在discriminative model D中得到一个较高的评分
图:GAN的训练收敛过程im

蓝色表示D总结
绿色表示G数据
黑色表示原数据img
2019年8月18日di
于南湖畔co
欢迎关注本站公众号,获取更多信息