《Reinforcement Learning》 读书笔记 2:多臂老虎机(Multi-armed Bandits)

《Reinforcement Learning: An Introduction》 读书笔记 - 目录 Reinforcement Learning 和 Supervised Learning 的区别 evaluate vs instruct 也就是说,RL的对于每一个action的效果不是非黑即白的,而是在每一次的action之后都可能不一样的后果(feedback, reward) 非iid,
相关文章
相关标签/搜索