DeepMind的AI学会了画画,利用强化学习彻底不需人教

邓侃解读:DeepMind如何教AI自主学会画画?算法

给你一幅油画,问你是否是梵高风格,这个问题很容易回答。可是让你用文字描述,什么是梵高风格,却很难清晰地界定。函数

如何让电脑自动模仿梵高油画?DeepMind 想了一个办法。学习

1. 用强化学习算法,像走迷宫那样,在画布上涂抹颜色。刚开始时,不妨把强化学习算法设定为随机行走。一通乱走,直到把画布填满。设计

2. 强化学习算法须要设定报酬函数,评定算法的好坏,而后反复调整算法参数,使得报酬最大。刚开始时,随机涂鸦的做品,固然离梵高风格差距很大。差距越大,报酬越低。反复调整算法参数,使之得到的报酬愈来愈高。直到报酬再也不增加,训练过程结束。blog

3. 设计一个报酬函数,若是电脑的做品,与梵高做品越类似,那么报酬越高。如何设计报酬函数呢?一个办法是作一个分类器(classifier),若是这个分类器,可以垂手可得地辨别电脑的做品,不是梵高油画,那么报酬越低。反之,若是分类器傻傻分不清哪一幅是电脑做品,哪一幅电脑做品,那么说明电脑已经模仿得很像,这时报酬很高。class

eaec4692cf3869503fb3fb48be662403a585568b

DeepMind 用这个算法,教电脑模仿手写体数字,教电脑画头像。最后成像效果不错,可是笔划顺序不对。im

相关文章
相关标签/搜索