【AAAI Oral】利用深度增强学习自动解数学题，准确率提升15%

时间 2021-01-13

原文原文链接

【AI科技大本营导读】增强学习和人类学习的机制非常相近，DeepMind已经将增强学习应用于AlphaGo以及Atari游戏等场景当中。作为智能教育领域的引领者，阿凡题研究院首次提出了一种基于DQN（Deep Q-Network）的算术应用题自动求解器，能够将应用题的解题过程转化成马尔科夫决策过程，并利用BP 神经网络良好的泛化能力,存储和逼近增强学习中状态-动作对的Q 值。实验表明该算法在标准测

>>阅读原文<<