Generative Adversarial Networks overview(4)

Libo1575899134@outlook.comhtml

Libo算法

(原创文章,转发请注明做者)微信

本文章主要介绍Gan的应用篇,3,主要介绍图像应用,4, 主要介绍文本以及医药化学其余领域应用网络

原理篇请看上两篇框架

https://www.cnblogs.com/Libo-Master/p/11167804.html函数

https://www.cnblogs.com/Libo-Master/p/11169198.html学习

图像应用大数据

https://www.cnblogs.com/Libo-Master/p/11187799.html编码

-----------------------------------------------------------------------------------spa

本文主要介绍在文本和医药化学上的应用,其实惟一的化学式分子式是能够经过一系列字符串表示的SEQ-GAN是第一个在文本中work的GAN,由上交的组作的,比较暴力的对离散不能求导的问题,用RL的Policy Gradient来解决,先介绍框架,把文本生成变成了加强学习的过程,奖励在每次生成完完整的文本序列后,获得一个Reward,这个Reward做为这次加强学习的Reward,经过Reward不断迭代策略,之因此要这么作是由于直接把文本用在Gan中会出现刚才说的问题,每次生成出来的文本是一个离散的序列,不论是汉字仍是英文是没法直接求导的,好比没法给梯度加减0.1获得另一个字符,没法在离散空间作字符的变换,不得不转化到加强学习的框架来作,当时作的任务是唐诗宋词五言的生成,基于奥巴马演讲生成的东西,还作了音符也能够认为是个离散序列。

后来有人也作了相关的改进,把Reward不是用到了加强学习中,而是用到了判别器获得的score融合到了基于最大似然的训练的目标函数中,变到了一个稳定的去求解过程。

如今微信也有不少接口,效果也比较好,是由于他们的工做加了不少特征,手动feature,好比要求生成符合韵律的(平仄),都会编码的生成过程当中的,还有些意向的映射好比山水都会编码进去。

而后在PTB(一个经典的小数据集文本)的生成的一些句子,基于词建模,一次生成了一些词而不是句子,因此并不会有拼写错误的状况。大意都是在一个topic下的什么事情。

下面是在一个大数据集上生成的结果,是基于improve-WGAN的基础上作的,并无转化到一个加强学习的框架下,是直接在特征空间或者隐空间来处理这些文本,通常都是把原始的文本映射到一个连续的隐空间中,而后再经过一个连续的隐空间解码成一个离散文本,这是通常的文本生成的过程。而后在解码出来的离散空间来判别是真是假,须要用一些加强学习作(没有办法反向传播的问题),可是若是在连续空间直接判别是真是假,直接能够解决不能求导的问题,可是在连续空间作判别太简单了,很容易判别出假样本是假的,真样本是真的,这会致使整个gan没办法训练起来,由于是一个对抗过程,若是生成不了可以欺骗判别器的假样本,生成器就永远不能提升,训练不起来,判别器也没法提升本身,最终就失败了,因此用了W-GAN 就可使得离散空间也能够训练判别器 ,不须要借助加强学习,每次只生成一个字母 字符级别的,能够建模语言信息了。

有了普通的文本生成,又作了一些条件的生成,生成一些跟给定文本相关的文本,相关就是在不一样任务上体现,对话生成,既符合天然语言的话,又符合上下文逻辑的话,回应用户的对话,下面是一个问路的例子

下面是一个租房的例子。

下面是斯坦福博士的,把Adversarial traning 应用在了对话中,下面是解码的结果,他们一样把Gan的生成用到了加强学习中,加强学习具体有多种解法,不一样的解法生成的文本长短和内容都会有较大的区别,有些时候生成反问句,有些时候会生成陈述句

后面有些人把对抗训练,用在了机器翻译的任务上,是今年微软亚洲研究院的工做,下面加粗的文本是翻译的结果,第二行是加了对抗训练的结果,能够看到加了对抗学习能够减小拼写错误,减小细微的语法错误,在细微流畅度上获得提高。

下图显示了网络结构,黄色为生成器,红色为判别器,每次先生成假样本,传给判别器。得出80%为真仍是20%为真,这个reward,对于更新算法的强度有不一样的影响。

能够看到如今在NLP领域,对抗训练主要作细微事情的调整,传统的RNN或者LSTM在生成过程当中已经只能达到必定程度了,但加了对抗训练的话能够精益求精。

下面是生成符合某一类特性的文本,好比餐馆的评价或者商品的评价,生成满意的评价或者不满意的。下面是CMU的工做。

 

他们是怎么实现的呢?

加入了C,一个额外的变量去控制特征,利用判别器去判别,有没有符合判别器但愿生成的特征,最终生成出既知足语言又知足特征。

如今controllable-gan 扩展到对话生成上,由于对话中会有不少隐含的情绪,沟通状态,情绪如何,好比下命令和问问题的意图不一样的。

 

 未完

------------------------------------------- 

相关文章
相关标签/搜索