DeepMind的AI学会了画画，利用强化学习彻底不需人教

时间 2019-12-07

原文原文链接

邓侃解读：DeepMind如何教AI自主学会画画？算法

给你一幅油画，问你是否是梵高风格，这个问题很容易回答。可是让你用文字描述，什么是梵高风格，却很难清晰地界定。函数

如何让电脑自动模仿梵高油画？DeepMind 想了一个办法。学习

1. 用强化学习算法，像走迷宫那样，在画布上涂抹颜色。刚开始时，不妨把强化学习算法设定为随机行走。一通乱走，直到把画布填满。设计

2. 强化学习算法须要设定报酬函数，评定算法的好坏，而后反复调整算法参数，使得报酬最大。刚开始时，随机涂鸦的做品，固然离梵高风格差距很大。差距越大，报酬越低。反复调整算法参数，使之得到的报酬愈来愈高。直到报酬再也不增加，训练过程结束。blog

3. 设计一个报酬函数，若是电脑的做品，与梵高做品越类似，那么报酬越高。如何设计报酬函数呢？一个办法是作一个分类器（classifier），若是这个分类器，可以垂手可得地辨别电脑的做品，不是梵高油画，那么报酬越低。反之，若是分类器傻傻分不清哪一幅是电脑做品，哪一幅电脑做品，那么说明电脑已经模仿得很像，这时报酬很高。class

DeepMind 用这个算法，教电脑模仿手写体数字，教电脑画头像。最后成像效果不错，可是笔划顺序不对。im