阿尔法狗的秘密：人工智能中的强化学习

时间 2020-12-29

原文原文链接

在有监督学习（supervised learning）中，训练数据中包含了数据样本的目标。不过现实中可没有上帝一样的监督者给出这些目标或答案！强化学习（reinforcement learning）是人工智能（AI）的一个重要分支，它也是DeepMind的阿尔法狗（AplhaGo）得以实现的一块基石。在强化学习中，虽然没有现成的答案，但是代理（agent）仍然必须决定如何行动（action

>>阅读原文<<