C. 人工智能 --- 强化/增强学习

时间 2020-12-29

原文原文链接

C. 强化/增强学习离散马尔可夫模型马尔科夫链马尔可夫决策过程动态规划贝尔曼方程策略估计策略改进策略迭代值迭代蒙特卡罗方法时间差分法隐马尔可夫模评估问题：前向后向算法解码问题：维特比算法（Viterbi）学习问题：前向后向算法（BAUM-WELC