DRL之DQN Deep Q Network 学习总结

本次总结从最底下的Ref Links的material中得来,如果对于某些细节不清楚可以看看链接中的内容。我在看10-703的视频的时候,我觉得Russ讲课还是很不错的,很多东西讲得言简意赅,短短几句就把DQN的核心讲得清楚。 RL中核心的三个东西:policy,model和value function。policy就是根据当前的state进行对应的action,当然可以是deterministi
相关文章
相关标签/搜索