大规模知识图谱数据流设计

知识图谱的数据量,更新方式,使用场景的不同,决定其数据流如何设计。 在应用有着上亿级别的节点数,数据存在着离线批量更新以及用户实时手工修改两种方式,使用场景也有着图查询以及模糊的搜索查询。这样就决定着数据流设计如下图: 分别介绍其中的功能模块: (1)图数据库 采用图数据库来存储知识图谱的数据,图数据库天然地满足节点–>关系–>节点这种存储格式。目前业界多使用neo4j,titan等,使用分布式图
相关文章
相关标签/搜索