阿尔法狗的秘密:人工智能中的强化学习

在有监督学习(supervised learning)中,训练数据中包含了数据样本的目标。 不过现实中可没有上帝一样的监督者给出这些目标或答案! 强化学习(reinforcement learning)是人工智能(AI)的一个重要分支,它也是DeepMind的阿尔法狗(AplhaGo)得以实现的一块基石。 在强化学习中 ,虽然没有现成的答案,但是代理(agent)仍然必须决定如何行动(action
相关文章
相关标签/搜索