【说在前面】本人博客新手一枚,象牙塔的老白,职业场的小白。如下内容仅为我的看法,欢迎批评指正,不喜勿喷![认真看图][认真看图]html
【补充说明】若是你对知识图谱感兴趣,欢迎先浏览个人另外一篇随笔:基于图模型的智能推荐算法学习笔记python
分享一下肖仰华教授的报告。报告深度剖析知识图谱的发展进程,系统整理知识图谱上半场的主要成果,分析知识图谱下半场的挑战与机遇,以期为各行业的认知智能实践带来有益的参考。面试
① 大规模简单知识表示算法
② 知识获取数据库
③ 基于知识图谱的简单推理网络
① 语言表达鸿沟数据结构
② 缺失的因果链条app
③ 碎片化数据的关联与融合框架
④ 深化行业数据的理解与洞察 机器学习
⑤ 显著提高了机器的天然语言理解水平
⑥ 基于知识图谱的大规模知识服务
⑦ 知识图谱可视化已大量应用
⑧ 大数据知识工程理论体系日趋完善
① 繁杂的应用场景
② 深度的知识应用
③ 密集的专家知识
④ 有限的数据资源
知识表示方面:
① 与其余知识表示的协同表示与推理
② 知识图谱的多模态表示
③ 知识图谱的个性化表示
知识获取方面:
① 发展低成本知识获取方法
② 注重多粒度知识获取
③ 发展大规模常识知识获取
④ 复杂知识获取机制与方法
知识应用方面:
① 知识图谱应用透明化
② 基于知识图谱的可解释人工智能
③ 发展符号知识指导下的机器学习模型
▌总结
分享一下PlantData的文章:行业知识图谱构建与应用。
知识图谱结构拓扑图如图所示:
企业全量数据应用挑战及应对策略:
(1)多源异构数据难以融合
使用知识图谱(本体)对各种数据建模,基于可动态变化的数据模型(概念-实体-属性-关系),实现统一建模。
(2)数据模式动态变迁困难
使用可支持数据模式动态变化的知识图谱的数据存储。
(3)非结构化数据计算机难以理解
利用信息抽取技术。
(4)数据使用专业程度太高
(5)分散的数据难以统一消费利用
在知识融合的基础上,基于语义检索、知识问答、图计算、推理、可视化等技术,提供数据检索/分析/利用,统一平台。
(1)以实体为主体目标,实现对不一样来源的数据进行映射与合并。(实体抽取与合并)
(2)利用属性来表示不一样数据源中针对实体的描述,造成对实体的全方位描述。(属性映射与归并)
(3)利用关系来描述各种抽象建模成实体的数据之间的关联关系,从而支持关联分析。(关系抽取)
(4)经过实体连接技术,实现围绕实体的多种类型数据的关联存储。(实体连接)
(5)使用事件机制描述客观世界中动态发展,体现事件与实体间的关联;并利用时序描述事件的发展情况。(动态事件描述)
知识建模工具:Protégé(本体编辑器,较局限)
知识抽取的主要策略如图所示(针对结构化、半结构化、非结构化数据的处理方式不一样):
知识抽取中的文本信息抽取,主要包括:实体识别、关系抽取、事件抽取、概念抽取。信息抽取主要有两大类工具:
非结构化文本数据的处理包括如下步骤:
其中,事件抽取能够分为预约义事件抽取和开放域事件抽取,行业知识图谱中主要为预约义事件抽取。采用模式匹配方法,包括三个步骤:
还有基于机器学习模型的抽取:SVM、逻辑回归、CRF、LSTM等:
补充说明,关于知识表示,欢迎先浏览个人另外一篇随笔:基于图模型的智能推荐算法学习笔记,这里再也不赘述。
(1)数据层融合:实体连接技术
即等同性判断:给定不一样数据源中的实体,判断其是否指向同一个真实世界实体(实体属性与关系的合并)。
实体连接工具:Wikipedia Miner、DBpedia Spotlight等,大部分都是针对百科类的知识库工做的,基本不支持中文的处理。
(2)语义描述层融合:Schema Mapping
固然还有一些别的须要考虑,例如多源知识融合、冲突检测与解决、跨语言融合、知识验证等。
例如,经过人机交互接口对错误信息进行人工纠正,并以此做为种子案例,经过强化学习增强模型的识别精度和鲁棒性。
知识图谱是基于图的数据结构,其存储方式主要有两种方式:RDF存储和图数据库。
下面展现各大图数据库的对比:
(1)基于图论的相关算法:
(2)本体推理:使用本体推理进行新知识发现或冲突检测。
本体知识推理工具:RDFox。
(3)基于规则的推理:使用规则引擎,编写相应的业务规则,经过推理辅助业务决策。
基于规则推理工具:Drools 规则定义。
智能问答(基于语义解析的方法+基于信息检索的方法)、语义搜索(基于实体连接)、可视化决策支持(D3.js、ECharts)等。
举例金融业的基于知识图谱的风险管理:
可构建的图谱:例如公司图谱、产品图谱、⼈物图谱、智能预警等。在行业应用中使用知识图谱,大体有以下几种方式:
若是您对异常检测感兴趣,欢迎浏览个人另外一篇博客:异常检测算法演变及学习笔记
若是您对智能推荐感兴趣,欢迎浏览个人另外一篇博客:智能推荐算法演变及学习笔记 、CTR预估模型演变及学习笔记
若是您对时间序列分析感兴趣,欢迎浏览个人另外一篇博客:时间序列分析中预测类问题下的建模方案 、深度学习中的序列模型演变及学习笔记
若是您对数据挖掘感兴趣,欢迎浏览个人另外一篇博客:数据挖掘比赛/项目全流程介绍 、机器学习中的聚类算法演变及学习笔记
若是您对人工智能算法感兴趣,欢迎浏览个人另外一篇博客:人工智能新手入门学习路线和学习资源合集(含AI综述/python/机器学习/深度学习/tensorflow)、人工智能领域经常使用的开源框架和库(含机器学习/深度学习/强化学习/知识图谱/图神经网络)
若是你是计算机专业的应届毕业生,欢迎浏览个人另一篇博客:若是你是一个计算机领域的应届生,你如何准备求职面试?
若是你是计算机专业的本科生,欢迎浏览个人另一篇博客:若是你是一个计算机领域的本科生,你能够选择学习什么?
若是你是计算机专业的研究生,欢迎浏览个人另一篇博客:若是你是一个计算机领域的研究生,你能够选择学习什么?
若是你对金融科技感兴趣,欢迎浏览个人另外一篇博客:若是你想了解金融科技,不妨先了解金融科技有哪些可能?
以后博主将持续分享各大算法的学习思路和学习笔记:hello world: 个人博客写做思路