强化学习--综述3之强化学习的分类

时间 2019-12-08

标签强化学习综述分类繁體版

原文原文链接

强化学习的分类 RL 算法能够分为基于模型的方法(Model-based)与免模型的方法(Model-free)。 1）前者主要发展自最优控制领域。一般先经过高斯过程(GP)或贝叶斯网络(BN)等工具针对具体问题创建模型,而后再经过机器学习的方法或最优控制的方法,如模型预测控制(MPC)、线性二次调节器(LQR)、线性二次高斯(LQG)、迭代学习控制(ICL)等进行求解。 2）然后者更

>>阅读原文<<