本文系腾讯云安全团队李航宇、邓昶博撰写git
图数据库在挖掘黑灰团伙以及创建安全知识图谱等安全领域有着自然的优点。为了能更好的服务业务,选择一款高效而且贴合业务发展的图数据库就变得尤其关键。本文挑选了几款业界较为流行的开源图数据库与 Nebula Graph 进行了多角度的对比。github
图数据库介绍
Neo4j
Neo4j 是目前业界普遍使用的图数据库,包含社区版本和商用版本,本文中使用社区版本。数据库
HugeGraph
HugeGraph 是百度基于 JanusGraph 改进而来的分布式图数据库,主要应用场景是解决百度安全事业部所面对的反欺诈、威胁情报、黑产打击等业务的图数据存储和图建模分析需求。具备良好的读写性能。安全
Nebula Graph
Nebula Graph 是一款开源的分布式图数据库,采用 shared-nothing 分布式架构,擅长处理千亿节点万亿条边的超大规模数据集,从而更好地服务企业级应用。架构
测试硬件环境
性能对比
咱们使用不一样量级的图从入库时间,一度好友查询,二度好友查询,共同好友查询几个方面进行了对比,结果以下:分布式
能够看到在导入性能上,数据量小的时候 Nebula Graph 的导入效率稍慢于 Neo4j,但在大数据量的时候Nebula Graph 的导入明显优于其余两款图数据库;在 3 种查询场景下, Nebula Graph 的效率都明显高于 Neo4j,与 HugeGraph 相比也有必定的优点。性能
查询语言对比
从查询语句的角度出发,Gremlin 比较复杂,nGQL 和 Cypher 比较简练,从可读性角度出发,nGQL 比较类 SQL 化,比较符合你们的使用习惯。学习
可视化对比
在可视化方面,全部的平台都还只处于可用状态,Nebula Graph 的选择性扩展在团伙挖掘中是一个加分项,可是在二度结果展现流畅度,展现结果自定义展现方面还有优化空间。测试
在比较了多款业内主要使用的开源数据库后,咱们从性能,学习成本和与业务的贴合程度多个角度考虑,最终选择了性能出众,上手简单,能大幅提升业务效率的 Nebula Graph 图数据库。大数据
本文首发于 Nebula Graph 论坛,阅读本文的你有任何疑问,欢迎前往论坛和做者进行讨论,原帖传送门:https://discuss.nebula-graph.com.cn/t/topic/1013