【Tom M. Mitchell课件】机器学习——强化学习(1)

本课件主要内容包括: 强化学习 强化学习:西洋双陆棋 强化学习问题 马尔科夫决策过程 HMM,马尔科夫过程,马尔科夫决策过程 自主智能体的强化学习任务 每种策略的值函数 值迭代方法 Q学习 学习Q的训练准则 更新策略 不确定情况 时间差分学习 MDP与RL MDP与强化学习的未来研究方向 完整课件下载地址: http://page2.dfpan.com/fs/flcj42211291c6efe78
相关文章
相关标签/搜索