强化学习入门……的入门

时间 2021-01-17

原文原文链接

强化学习是机器学习里面非常重要的一个派别。智能体 (agent) 会不断执行一些操作，通过结果来学习，在不同的环境中分别应该采取怎样的行动。在一系列教学文章里，我们可以了解不同的架构，来解决强化学习的问题。Q学习，深度Q网络 (DQN) ，策略梯度 (Policy Gradients) ，演员-评论家 (Actor-Critic) ，以及近端策略优化 (PPO) 都是将要涉及的算法。这是本系列

>>阅读原文<<