芝麻HTTP:非关系型数据库存储

NoSQL,全称Not Only SQL,意为不单单是SQL,泛指非关系型数据库。NoSQL是基于键值对的,并且不须要通过SQL层的解析,数据之间没有耦合性,性能很是高。数据库

非关系型数据库又可细分以下。性能

  • 键值存储数据库:表明有Redis、Voldemort和Oracle BDB等。
  • 列存储数据库:表明有Cassandra、HBase和Riak等。
  • 文档型数据库:表明有CouchDB和MongoDB等。
  • 图形数据库:表明有Neo4J、InfoGrid和Infinite Graph等。

对于爬虫的数据存储来讲,一条数据可能存在某些字段提取失败而缺失的状况,并且数据可能随时调整。另外,数据之间还存在嵌套关系。若是使用关系型数据库存储,一是须要提早建表,二是若是存在数据嵌套关系的话,须要进行序列化操做才能够存储,这很是不方便。若是用了非关系型数据库,就能够避免一些麻烦,更简单高效。文档

本节中,咱们主要介绍MongoDB和Redis的数据存储操做。it

相关文章
相关标签/搜索