NoSQL概述

击上方蓝色字体,选择“置顶或者星标” web

优质文章第一时间送达!sql

NoSQL概述

为何要使用Nosql

咱们如今处理什么年代    2020年  大数据时代  适者生存 学习才是在这个社会生存的惟一法则。数据库

1.单机MySQL的年代

90年代, 一个基本网站访问量通常不会太大, 单个数据库彻底足够!那个时候更多的使用静态网页 HTML 服务器根本没有压力 思考下:整个网站的瓶颈是什么?编程

  • 数据量太大, 一个机器放不下json

  • 数据索引 (300万条数据就必定创建索引! B+树), 一个机器内存也放不下浏览器

  • 访问量(读写混合), 一台服务器承受不了缓存

只要你开始出现以上三种状况之一, 那么就必须晋级!服务器

2.Memcached(缓存) + MySQL + 垂直拆分

网站80%的状况都是在读数据, 每次都要查询数据就很麻烦, 因此说咱们但愿减轻数据压力, 咱们可使用缓存来保证效率!微信

发展过程:优化数据结构-->文件缓存(IO)-->Memcached(缓存 当时最热门的技术!)网络

3.分库分表+水平拆分+MySQL集群

技术和业务发展的同时, 对人的要求也愈来愈高 本质:数据库(读 写)

早些年MyISAM:表锁, 十分影响效率!高并发下就会出现严重的问题, 转到Innodb:行锁

慢慢的就开始使用分库分表来解决写的压力! MySQL在那个年代推出了表分区 这个并无多少公司使用 MySQL集群

4.现在年代

技术爆炸 2010-2020   十年之间, 世界发生翻天覆地的变化

MySQl关系型数据库就不够用了, 数量巨多, 变化很快

MySQL有的使用它来存储一些比较大的文件, 博客 图片    数据库表很大, 效率就低了!若是有一种数据库专门来处理这种数据 MySQL的压力就会十分小(研究如何处理这些问题) 大数据IO压力下, 表几乎没办法更大!

5.目前一个基本互联网项目!

6.为何要用NoSQL

用户的我的信息, 社交网络, 地理位置. 用户本身产生的数据, 用户日志等等爆发式的增加 这时候咱们就应该使用NoSQL数据库, NoSQL能够很好的处理以上的状况.

什么是NoSQL

NoSQL

NoSQL = Not Only SQL(不只仅是SQL)泛指非关系型数据库,随着 Web2.0 互联网的诞生, 传统关系型数据库很难对付web2.0时代!尤为是超大规模的高并发的社区 暴露出不少难以克服的问题, NoSQL在当今大数据环境下发展的十分迅速,Redis是发展最快的,并且当下必须掌握一个技术

不少数据类型用户的我的信息,社交网络,地理位置。这些数据类型的存储要有一个固定的格式!不须要多余的格式就能够横向扩展的!Map<String, Object> 使用键值对

NoSQL特色

解耦

  • 方便拓展(数据之间没有关系, 很好扩展)

  • 大数据量 高性能(Redis一秒些8万次  读取11万    NoSQL的缓存记录, 是一种细粒度的缓存, 性能会比较高)

  • 数据类型是多样的!(不须要事先设计数据库!   随取随用    若是是十分大的表, 不少人就没法设计了)

  • 传统的RDBMS和NoSQL

    • 传统的RDBMS:结构化组织、SQL、数据和关系都存在单独的表中row col、操做数据、数据定义语言、严格的一致性、基础事务......

    • NoSQL: 不只仅是数据、没有固定的查询语言、键值对存储、列存储、文档存储(社交关系)、最终一致性、CAP原理 和 BASE (异地多活)、高性能、高可用、高可扩、......

了解3V + 3高

大数据时代的3V:主要描述问题

  • 海量Volume

  • 多样Variety

  • 实时Velocity

大数据时代的3高:主要是对程序的要求

  • 高并发

  • 高可扩(随时水平拆分,机器不够用了,能够扩展机器)

  • 高性能(保证咱们的用户体验)

真正在公司中的实践:NoSQL + RDBMS 一块儿使用才是最强大的, 阿里巴巴的架构引进.

阿里巴巴演进分析

思考问题 这么多的数据难道都是在一个数据库中的么?

敏捷开发、极限编程

开源才是技术的王道

任何一家互联网公司,都不可能简简单单让用户能用就行了 大量公司作的都是相同的业务;(竞品协议)

若是将来至关一个架构师:没有什么是加一层解决不了的!

商品的基本信息

名称 价格 商家信息 关系型数据库就能就解决 MySQL/oracle (淘宝早就去IOE了    王坚:推荐文章 :阿里云的这群疯子) 淘宝内部的MySQL 不是你们用的MySQL

商品描述 评论(文字比较多)

文档型数据库中  MongDB

图片

分布式文件存储系统 FastDFS

  • 淘宝本身的    TFS

  • Google       GFS

  • Hadoop       HDFS

  • 阿里云的      oss

商品关键字(搜索)

  • 搜索引擎:solr   elasticsearch

  • ISerach:多隆(多关注技术大佬)

商品热门的波段信息

  • 内存数据库‘

  • Reids Tair  Memache

商品的交易   外部的支付接口

  • 第三方应用

要知道, 一个简单的网页背后的技术必定不是你们所想象的那么简单

大型互联网应用问题

  • 数据类型太多了

  • 数据源多, 常常重构(敏捷开发)!

  • 数据要改造, 大面积改造

解决问题:

 

NoSQL的四大分类

KV键值对

  • 新浪:Redis

  • 美团:Redis + Tair

  • 阿里、百度:Redis + memecache

文档型数据库(bson格式   和json同样)

  • MongoDB(通常必需要掌握)

    • MongoDB是一个基于分布式文件存储的数据库, C++编写, 主要用来处理大量的文档

    • MongoDB是一个介于关系型数据库和非关系型数据库中中间产品   MongoDB是非关系型数据库中功能最丰富, 最像关系型数据库.

  • ConthDB

列存储

  • HBase

  • 分布式文件系统

图关系数据库

  • 他不是存储图形, 放的是关系, 好比:朋友圈社交网络   广告推荐

  • Neo4j InfoGrid

四者对比

 

Web1.0:以静态、单向阅读为主,网站内信息能够直接和其余网站信息进行交互,能经过第三方信息平台同时对多家网站信息进行整合使用。

Web2.0:以分享为特征的实时网络,用户在互联网上拥有本身的数据,并能在不一样的网站上使用。

Web3.0:将以网络化和个性化为特征,提供更多人工智能服务,彻底基于Web,用浏览器便可实现复杂的系统程序才具备的功能。

Web3.0的特征分析:一、微内容(Widget)的自由整合与有效聚合 二、适合多种终端平台,实现信息服务的普适性 三、良好的人性化用户体验,以及基础性的个性化配置 四、有效和有序的数字新技术

 

本文分享自微信公众号 - 掌上编程(ThePalmJava)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。

相关文章
相关标签/搜索