写给人类的机器学习五、强化学习

时间 2021-01-12

原文原文链接

五、强化学习原文：Machine Learning for Humans, Part 5: Reinforcement Learning 作者：Vishal Maini 译者：飞龙协议：CC BY-NC-SA 4.0 探索和利用。马尔科夫决策过程。Q 学习，策略学习和深度强化学习。我刚刚吃了一些巧克力来完成最后这部分。在监督学习中，训练数据带有来自神一般的“监督者”的答案。如果生活可以这样