强化学习实例7：价值迭代法（value iteration）

时间 2019-12-06

标签强化学习实例价值迭代 value iteration 繁體版

原文原文链接

策略迭代法，能够进一步优化为最大化价值vpython # 价值迭代法 class ValueIteration(object): def value_iteration(self, agent, max_iter=-1): iteration = 0 while True: iteration += 1 new

>>阅读原文<<

最新文章

欢迎关注本站公众号,获取更多信息