写给人类的机器学习 五、强化学习

五、强化学习 原文:Machine Learning for Humans, Part 5: Reinforcement Learning 作者:Vishal Maini 译者:飞龙 协议:CC BY-NC-SA 4.0 探索和利用。马尔科夫决策过程。Q 学习,策略学习和深度强化学习。 我刚刚吃了一些巧克力来完成最后这部分。 在监督学习中,训练数据带有来自神一般的“监督者”的答案。如果生活可以这样
相关文章
相关标签/搜索