NoSQL性能测试:MongoDB VS SequoiaDB

做为NoSQL的一个重要类型,文档型NoSQL一般被认为是最接近传统关系型数据库的NoSQL。文档型NoSQL的核心是数据嵌套,这种设计能够从某 种程度上大大简化传统数据库复杂的关联问题。同时因为摆脱了关系模型里面的强一致性限制,文档型NoSQL还能够作到水平扩张与高可用。相比其余的 NoSQL类型,文档型NoSQL的应用范围要普遍的多。

  常见的文档型NoSQL包括MongoDB、CouchDB等,其中MongoDB是一个高性能、开源、无模式的文档型数据库,它在许多场景下 可用于替代传统的关系型数据库或键/值存储方式,MongoDB使用C++开发,提供了不少功能,如面向集合的存储、动态查询、完整的索引支持、查询监 视、复制及自动故障转移、高效的传统存储方式、自动分片以支持云级别的伸缩性。 html

  SequoiaDB(巨杉数据库)做为文档型NoSQL家族中的新成员,其企业级的新特性颇受关注。根据SequoiaDB官网的描述,该数据 库在提供文档类JSON接口的同时,可以替代HBase做为Hadoop的存储引擎。与MongoDB相比,其Hadoop接口较为完善。所以,本文将 MongoDB与SequoiaDB两款文档型NoSQL同时进行测试,对比二者的功能和性能。 数据库

  1、测试环境 服务器

  本次测试基于的环境是6台刀片机,每台的配置为4核AMD Opteron 2378 2.4GHz,内存4GB的服务器,2x150GB Raid 0本地磁盘。操做系统使用SLES 11SP2(Kernel:3.0.13-0.27-default x86_64)。 多线程

  MongoDB部署在6台刀片机上,每台物理机做为一个单节点Shard。其中两台物理机还部署了Config Server,另一台物理机部署了mongos进程。 并发

  SequoiaDB部署在6台刀片机上,每台物理机做为一个单节点复制组,其中两台物理机还部署了编目节点,另一台物理机部署了协调节点。 异步

  MongoDB与SequoiaDB均使用“id”做为分区键字段,每条记录平均550字节,均采用手工指定分区方式分区。 分布式

  2、主要功能对比 oop

功能 性能

MongoDB 测试

SequoiaDB

开发语言

C++

C++

类型

文档类

文档类

分布式机制

Sharding

Sharding

数据格式

JSON/BSON

JSON/BSON

操做界面

Javascript

Javascript

支持多索引

支持

支持

Hadoop支持

支持内置MapReduce

支持Hadoop MapReduce查询,可以链接Pig/Hive接口

支持范围切分与散列切分

支持

支持

支持汇集操做

支持

支持

其余功能

支持地理索引

支持跨集合跨节点事务、内置支持类SQL查询、支持数据压缩

主要应用场景

数据类型多变,须要动态查询,须要多字段索引

数据类型多变,须要动态查询,须要多字段索引,须要事务功能(提交回滚),Hadoop环境中的数据存储

  3、命令行操做对比

  如下命令行完成建立表(集合)、插入数据、查询数据、删除表(集合)四种操做。

  一、MongoDB

NoSQL性能测试:MongoDB VS SequoiaDB

  二、SequoiaDB

NoSQL性能测试:MongoDB VS SequoiaDB


  4、主要性能对比

  一、单节点单线程场景

  测试环境:1台刀片机,SequoiaDB/MongoDB为独立模式。

  录入场景:使用单线程本地TCPIP链接,插入1亿条记录。

  查询场景:使用单线程本地TCPIP链接,使用集合扫描1亿条记录,返回最后一条。

  (1)数据录入

  X轴表明数据库内包含的记录总数,Y轴表明数据库每秒插入记录数量。

主要性能对比

  (2)数据录入(平均)

  Y轴表明数据库平均每秒插入记录数量。

主要性能对比

  (3)数据查询

  Y轴表明数据库平均每秒扫描记录数量。

主要性能对比

  (4)占用空间

  Y轴表明插入1亿条记录后所占用的存储空间(单位MB)。

主要性能对比

  从以上测试结果能够看出,SequoiaDB在单节点、单线程的使用场景下,插入性能优于MongoDB,在查找某一特定记录方面 MongoDB略快于SequoiaDB,在特性方面,MongoDB的异步插入至关于批量插入,而SequoiaDB的压缩插入在比较占优点,性能相对 自身的批量插入提升了将近一倍,而空间节约就更加可观了。


  二、多节点多线程环境

  测试环境:6台HP刀片机,SequoiaDB/MongoDB为集群模式。

  录入场景:每台机器使用5线程本地TCPIP链接(总共30线程),总共插入1亿2千万条记录。

  查询场景:每台机器使用5线程本地TCPIP链接(总共30线程),每线程使用集合扫描1亿2千万条记录,返回最后一条。

  (1)数据录入

  X轴表明每条线程插入的记录总数,Y轴表明数据库单条线程每秒插入记录数量。

主要性能对比:多节点多线程环境

  (2)数据录入(平均)

  Y轴表明数据库单条线程平均每秒插入记录数量。

主要性能对比:多节点多线程环境

  (3)数据查询

  Y轴表明数据库单条线程平均每秒扫描记录数量。

主要性能对比:多节点多线程环境

  (4)表扫描

  X轴表明每条数据库中存在的记录总数,Y轴表明数据库单条线程每秒扫描记录数量。

主要性能对比:多节点多线程环境

  (5)占用空间

  Y轴表明插入1亿2千万条记录后所占用的总的存储空间(单位MB)。

主要性能对比:多节点多线程环境

  在同等状况下,都采用6个分区和手动分区,MongoDB也禁用了balancer,对MongoDB和SequoiaDB共有特性进行对比测 试。从以上测试结果能够看出,SequoiaDB的插入性能在并发状况下也远远优于MongoDB,虽然MongoDB在查询特定记录方面仍是略胜一筹, 可是从引入全表扫描的结果来看,一旦客户端查询而且取回记录集时,SequoiaDB优点突显。

  5、总结

  MongoDB和SequoiaDB做为文档型NoSQL的表明,在功能和性能表现上各有千秋。经过本次测试可以看出,MongoDB和 SequoiaDB的性能都很强劲,其中SequoiaDB更是表现不俗,相信在不久的未来SequoiaDB可以独当一面,打开企业级NoSQL市场的 局面。

相关文章
相关标签/搜索