强化学习--综述3之强化学习的分类

强化学习的分类   RL 算法能够分为基于模型的方法(Model-based)与免模型的方法(Model-free)。   1)前者主要发展自最优控制领域。一般先经过高斯过程(GP)或贝叶斯网络(BN)等工具针对具体问题创建模型,而后再经过机器学习的方法或最优控制的方法,如模型预测控制(MPC)、线性二次调节器(LQR)、线性二次高斯(LQG)、迭代学习控制(ICL)等进行求解。   2)然后者更
相关文章
相关标签/搜索