【论文笔记】M-Walk: Learning to Walk over Graphs using Monte Carlo Tree Search

本文用了强化学习,在知识图谱上游走,寻找目标节点。 一、简介 大概意思就是,在知识图谱上,给出一个起始节点和查询(query),然后找到目标节点。  图G包含节点和边。 如下图,给出起始节点Obama,query:citizenship,目标节点是USA。     我们要学习一个方法来预测。 我们我们将f作为强化学习力的agent。他要学习搜索策略(search policy) 训练的时候,我们给
相关文章
相关标签/搜索