知识图谱构建过程

知识图谱构建技术体系 知识获取:从不同来源、不同结构的数据中进行知识的提取,形成结构化的知识,当前知识的获取主要针对文本数据进行 实体抽取 众包:百度百科、维基百科,存储机器可读的、具有一定结构的数据 爬虫:通过定义网页中的实体、属性、关系的 pattern,实现对网页数据的获取,例如 Google、Baidu 的搜索引擎 机器学习:将数据变成考研理解的知识,例如通过文本分类、主题模型等,可以获取
相关文章
相关标签/搜索