【AAAI Oral】利用深度增强学习自动解数学题,准确率提升15%

【AI科技大本营导读】增强学习和人类学习的机制非常相近,DeepMind已经将增强学习应用于AlphaGo以及Atari游戏等场景当中。作为智能教育领域的引领者,阿凡题研究院首次提出了一种基于DQN(Deep Q-Network)的算术应用题自动求解器,能够将应用题的解题过程转化成马尔科夫决策过程,并利用BP 神经网络良好的泛化能力,存储和逼近增强学习中状态-动作对的Q 值。实验表明该算法在标准测
相关文章
相关标签/搜索