马尔可夫Markov决策过程

1. Markov Processes马尔可夫过程 1.1 Markov Property马尔可夫性 在了解马尔可夫过程之前,我们首先得了解什么是马尔可夫性,马尔可夫性其实是一种假设,“未来的一切仅与现在有关,独立于过去的状态”。 关于马尔可夫性,我们给出了如下的Definition: 从上述的式子可以看出,t+1时刻的状态包含了1,…,t时刻状态的全部历史信息,并且当我们知道t时刻的状态后,我们
相关文章
相关标签/搜索