Q-learning

学习增强学习有段时间了,也接触了Q-learning了。但对此理解不是很透彻,知道看到头条文章对一篇post翻译文才对此有了较深的理解,特此copy,望见谅。 目录: 故事案例 Q-table简介 Q-learning 算法:学习动作值函数(action value function) Q-learning 算法流程 Q-learning 算法的伪代码 故事案例:骑士和公主 假设你是一名骑士,并且
相关文章
相关标签/搜索