【Tom M. Mitchell课件】机器学习——强化学习(1)

时间 2021-01-18

原文原文链接

本课件主要内容包括：强化学习强化学习：西洋双陆棋强化学习问题马尔科夫决策过程 HMM，马尔科夫过程，马尔科夫决策过程自主智能体的强化学习任务每种策略的值函数值迭代方法 Q学习学习Q的训练准则更新策略不确定情况时间差分学习 MDP与RL MDP与强化学习的未来研究方向完整课件下载地址： http://page2.dfpan.com/fs/flcj42211291c6efe78

>>阅读原文<<