DRL之DQN Deep Q Network 学习总结

时间 2021-01-15

原文原文链接

本次总结从最底下的Ref Links的material中得来，如果对于某些细节不清楚可以看看链接中的内容。我在看10-703的视频的时候，我觉得Russ讲课还是很不错的，很多东西讲得言简意赅，短短几句就把DQN的核心讲得清楚。 RL中核心的三个东西：policy，model和value function。policy就是根据当前的state进行对应的action，当然可以是deterministi