random大坑

时间 2020-12-24

原文原文链接

最近在入门强化学习，在写使用DQN学习CartPole时，出现了一个神奇的事情。我几乎把代码改的和参考程序一模一样了，结果参考程序跑出来完全正常，而我的程序跑出来就是这个鬼样子…… 就是loss一直在降低，但是reward一直在9左右徘徊，甚至expected average reward稳步下降…… 因为是python新手入门+深度学习新手入门，所以现在只会照着别人的代码写，自己用眼睛dubu

>>阅读原文<<

1. random
2. Random
3. Math中的random和Random类
4. Random Processes
5. Random类
6. Random/Stochastic
7. Random Walk
8. Random Forest
9. C# Random
10. random库
更多相关文章...
• Docker 命令大全 - Docker教程
• PHP PDO 大对象 (LOBs) - PHP参考手册
• JDK13 GA发布：5大特性解读
• 为了进字节跳动，我精选了29道Java经典算法题，带详细讲解