云数据库HBase助力物联网,免费申请中

云数据库HBase免费申请地址https://cn.aliyun.com/product/hbase

引言

从有线互联网到无线互联网,本质是增强了人与人之间随时随地的关联。下一个互联的时代是万物互联,也就是物联网。有人说,这个是第三次信息革命,无论咋样,这都会产生大量的数据。
举一个例子,杭州市有200w辆汽车(具体确定比这个多),咱们给每辆车安装一个传感器,每隔10s,上传1k的数据量,说明这个车的位置,一些状况。QPS为20w,1年的数据量为:365*360*24*200w*1k=5.73P ,若是不作任何的容灾,每一个磁盘4T来算,则须要 5.73*1024/4T=1466块磁盘,作一些容灾,则至少须要2000+的磁盘。这些数据蕴含着巨大的价值,分析这些数据后,则会改变整个杭州的交通。前端

架构

在咱们传统架构下,通常会使用关系型数据库,关系型数据库索引结构基本上都是类B+树,随着终端设备数增多,读写压力剧增,读写延迟增大,数据库面临崩溃;其次,关系型数据库也没法作到存储容量无限扩容,目前有一些分库分表的方案,实现起来比较复杂,每每有较多的限制。数据库

物联网最大的特色写入量大,要求延迟低,且数据存量巨大。HBase基于LSM,把磁盘的随机写改成顺序写,写吞吐高,不受SSD随机写入放大干扰,也不受空间放大的干扰。目前HBase很是知足物联网存储需求,存储数T、数P甚至百P的空间,延迟稳定在数毫秒以内,跟Hadoop分析体系有较为深刻的结合,知足分析类的需求。具体物理网的大体结构以下:
screenshot
主要流程:
一、一部分实时,直接走MQ,到流式系统,作一些实时的分析,后写入HBase。
二、一部分写入HBase,通常是全量数据,后接入Hadoop/Spark,作一些离线分析,后续结果写入HBase中。
每每在使用HBase时,使用的rowkey设计是:设备ID+地点+xxx+时间xxx架构

每一个云公司,都在前端的一些环节作了不少事情,好比提供硬件支持、协议支持、ECS能够使用一些弹性方案,固然也有很多公司是本身作方案。
针对数据从云HBase到EMR Hadoop/Spark中,目前有两种方案,其一是Hadoop、Spark直接链接云HBase分析;其二是云HBase提供一些导出数据的功能,在EMR中自动生成一张表(目前云HBase在实现中)。oop

云数据库HBase免费申请地址https://cn.aliyun.com/product/hbase设计

相关文章
相关标签/搜索