七月算法深度学习 第三期 学习笔记-第九节 强化学习与Deep Q-Network

强化学习相关成就: o Learned the world’s best player of Backgammon (Tesauro 1995)  o Learned acrobatic helicopter autopilots (Ng, Abbeel, Coates et al2006+)  o Widely used in the placement and selection of adv
相关文章
相关标签/搜索