本文整理了斯坦福大学 CS 520 知识图谱研讨会课程的第 10 集的内容,主要是关于知识图谱将来的研究方向,推荐给研究知识图谱的同窗们~算法
1 使用强化学习进行多跳知识图谱推理
第一位演讲者:Richard Sochar网络
Richard 认为知识图谱将来的一个重要研究方向是使用强化学习进行多跳知识图谱推理。框架
知识图谱的缺陷之一是不完整性,即知识图谱能存储的事实是有限的。对于知识图谱的重要应用——聊天机器人(Chatbot),也就是对话系统或者问答系统,其交互形式能够是文本或是图像。在对话过程当中须要根据知识图谱进行推理,但知识图谱关于目标问题的知识多是残缺或者有噪音的,因此算法应当具备必定的鲁棒性。对于知识图谱的不完整性,有如下解决方案:ide
知识图谱嵌入
知识图谱嵌入是一种发现缺失事实的有效方法。它将知识图谱中的全部实体或关系嵌入到连续向量空间中。采用强化学习进行推理时,可使用知识图谱嵌入,便于神经网络对实体进行处理。可是知识图谱嵌入一般缺乏可解释性。工具
多跳推理模型
现有的多跳推理模型一般采用序列决策的思路。从问题中提取实体,而后在知识图谱中学习如何在实体间进行推理。学习
强化学习框架
强化学习中须要关注五个要素:人工智能
多跳推理是可解释的,可是准确较低。经常将知识图谱嵌入与强化学习框架结合使用,从而兼顾可解释性和准确性。blog
该方法还能够推广到联合知识图谱和文本的多跳推理上。开发
2 知识图谱到底知道什么?
第二位演讲者:Mark A. Musen 博士it
Mark 想讨论的是很是根本的一个问题——咱们知道了什么是图,但什么是知识?咱们如何确保知识被存储到了图中?关于这个问题的答案,Mark从早年的研究历史开始谈起。
上世纪中叶,Stanford 想要开发一个专家系统,帮助医生作临床决策。他们先是考虑用语义网络来实现这一任务。还有一个早期用于帮助决策的专家系统,叫作MYCIN,出现于 70~80 年代。它是包含大量复杂的规则供专家进行决策。在这个年代,符号化的人工智能也被认为是医疗健康行业的将来。可是,对这类方法的质疑逐渐显现。包含大量规则的系统真的是能够维护的吗?语义网络(知识图谱)可以支持查找以外的任何形式的推理吗?什么样的知识表示可能能够支持一个最智能的系统呢?
Allen Newell 在 1980 年提出:咱们应该中止争论如何表示知识,真正重要的是系统中有怎样的知识,而不是如何用计算机进行表示。知识是观察者赋予智能体的。知识是解决问题的能力。
咱们又从新开始研究如何将知识表示为图。现在,庞大的知识图谱相比当年的语义网络,拥有更加丰富的信息。咱们已经知道一些表示和生成智能行为的方法了,但还有不少应用没有开始研究,有不少行为尚未想到如何去建模——这是咱们将来能够努力的方向。
3 Data Commons
第三位演讲者:RV Guha
数据正在驱动不少应用,政策、新闻、健康、科学等。目前的问题不在于数据的缺少,而是数据有太多的格式和规范。咱们搜寻数据源、清洗数据、搞定数据存储……在这个过程当中存在启动成本高昂,生态系统不完整,工具较少的问题。咱们如何使数据的使用变得更加简单?
Data Commons 是一个 Google 发起的项目,尝试解决知识图谱构建中的上述问题,从不一样数据源合成一个开放知识图谱。Guha 团队想要作的是,从本来搜索数据集、下载、清洗、归一化、融合的繁琐流程,简化到直接搜索谷歌便可得到数据集。
该项目的优点在于,经过清洗、归一化和将多个数据集进行融合的方式,轻松构建一个知识图谱,无需清理和加入数据。
目前经过 Data Commons 构建的知识图谱包括按地理区域的美国人口普查公报、美国国家海洋和大气管理局提供的天气历史与预报、美国劳工统计局的就业与失业统计等。
以上是对课程的简单的笔记,并不足以涵盖课程中的细节,感兴趣的同窗们能够刷起来啦~