Reinforcement Learning(一):introduction

A little bit probability theory Random Variable 随机变量:未知;它的值取决于随机事件的结果。用大写字母表示随机变量,观察值用小写字母表示,注意,观察值是没有随机性的。 Probability Density Function (PDF) PDF提供了随机变量的值与样本相等的相对可能性,比如下图的高斯分布以及离散分布: 满足以下性质: Expectat
相关文章
相关标签/搜索