David Silver RL课程第2课（Markov decision processes)

时间 2021-01-12

原文原文链接

1.Markov decision processes formally describe an environment for reinforcement learning Where the environment is fully observable The current state completely characterises the process Almost all RL p