【Tom M. Mitchell课件】机器学习——强化学习(2)

时间 2021-01-18

原文原文链接

本课件主要内容包括： HMM，马尔可夫过程，马尔可夫决策过程非确定的情况时间差分学习 MDP与RL MDP与强化学习：未来发展方向关于动物的强化学习？人类学习的RL模型大脑的RL理论时间差ML模型：预测学习过程中多巴胺能神经元活性完整课件下载地址： http://page2.dfpan.com/fs/6l6c1j12a211f249163/ 更多精彩文章请关注微信号：