再谈全局网HBase八大应用场景

摘要: HBase能够说是一个数据库,也能够说是一个存储。拥有双重属性的HBase天生就具有广阔的应用场景。在2.0中,引入了OffHeap下降了延迟,能够知足在线的需求。引入MOB,能够存储10M左右的对象,彻底适应了对象存储。另外因为自身的并发能力、存储能力,能够说是具备最为竞争力的引擎数据库

HBase概述

HBase是一个分布式存储、数据库引擎,能够支持千万的QPS、PB级别的存储,这些都已经在生产环境验证,而且在广大的公司已经验证。特别是阿里、小米、京东、滴滴内部都有数千、上万台的HBase集群。选择一个技术的首要条件是对齐大公司,大公司会投入大量的人力去维护、改进、贡献社区。架构

关于NewSQL与NoSQL的关系

技术老是不断向前发展的,现在都在提NewSQL,其实NewSQL在笔者看来是NoSQL之上的一个封装,一个子场景。NoSQL中的大表,典型就是提供了KV1V2……Vn,其中每一个V能够是1b,也能够是100MB。能够说是一个元的存在,就相似于数字世界的01,能够任意组合。在以HBase为表明的NoSQL中,HBase能够组合出任意的场景,NewSQL能够是之上加了SQL层或者更近一层添加事务的子场景。并发

关于计算与存储分离

在云上,对于引擎最为核心的就是存储计算分离,存储能够按需计费,起码得弹性伸缩。计算则按节点存储提供,彻底按照QPS计费,要么费用高得吓人,要么难以知足更多的场景。好比存储10M,到底算一次QPS,仍是多少次。 因为HBase天生就是存储计算分离,自然比较适配云上的架构,能够说到了云上,HBase更加具备优点。分布式

HBase场景

HBase能够说是一个数据库,也能够说是一个存储。拥有双重属性的HBase天生就具有广阔的应用场景。在2.0中,引入了OffHeap下降了延迟,能够知足在线的需求。引入MOB,能够存储10M左右的对象,彻底适应了对象存储。另外因为自身的并发能力、存储能力,能够说是具备最为竞争力的引擎工具

clipboard.png

  • 对象存储:咱们知道很多的头条类、新闻类的的新闻、网页、图片存储在HBase之中,一些病毒公司的病毒库也是存储在HBase之中
  • 时序数据:HBase之上有OpenTSDB模块,能够知足时序类场景的需求
  • 推荐画像:特别是用户的画像,是一个比较大的稀疏矩阵,蚂蚁的风控就是构建在HBase之上
  • 时空数据:主要是轨迹、气象网格之类,滴滴打车的轨迹数据主要存在HBase之中,另外在技术全部大一点的数据量的车联网企业,数据都是存在HBase之中
  • CubeDB OLAP:Kylin一个cube分析工具,底层的数据就是存储在HBase之中,很多客户本身基于离线计算构建cube存储在hbase之中,知足在线报表查询的需求
  • 消息/订单:在电信领域、银行领域,很多的订单查询底层的存储,另外很多通讯、消息同步的应用构建在HBase之上
  • Feeds流:典型的应用就是xx朋友圈相似的应用
  • NewSQL:之上有Phoenix的插件,能够知足二级索引、SQL的需求,对接传统数据须要SQL非事务的需求 更多的场景须要不断挖掘

以上,再次回顾,HBase的场景,作了一个简单的分类,后续会有一些针对一些场景的实际的案例spa

阅读原文插件

相关文章
相关标签/搜索