云数据库HBase助力物联网，免费申请中

时间 2019-12-09

标签数据库 hbase 助力联网免费申请栏目 SQL 繁體版

原文原文链接

云数据库HBase免费申请地址：https://cn.aliyun.com/product/hbase

引言

从有线互联网到无线互联网，本质是增强了人与人之间随时随地的关联。下一个互联的时代是万物互联，也就是物联网。有人说，这个是第三次信息革命，无论咋样，这都会产生大量的数据。
举一个例子，杭州市有200w辆汽车(具体确定比这个多)，咱们给每辆车安装一个传感器，每隔10s，上传1k的数据量，说明这个车的位置，一些状况。QPS为20w，1年的数据量为：365*360*24*200w*1k=5.73P ，若是不作任何的容灾，每一个磁盘4T来算，则须要 5.73*1024/4T=1466块磁盘，作一些容灾，则至少须要2000+的磁盘。这些数据蕴含着巨大的价值，分析这些数据后，则会改变整个杭州的交通。前端

架构

在咱们传统架构下，通常会使用关系型数据库，关系型数据库索引结构基本上都是类B+树，随着终端设备数增多，读写压力剧增，读写延迟增大，数据库面临崩溃；其次，关系型数据库也没法作到存储容量无限扩容，目前有一些分库分表的方案，实现起来比较复杂，每每有较多的限制。数据库

物联网最大的特色写入量大，要求延迟低，且数据存量巨大。HBase基于LSM，把磁盘的随机写改成顺序写，写吞吐高，不受SSD随机写入放大干扰，也不受空间放大的干扰。目前HBase很是知足物联网存储需求，存储数T、数P甚至百P的空间，延迟稳定在数毫秒以内，跟Hadoop分析体系有较为深刻的结合，知足分析类的需求。具体物理网的大体结构以下：

主要流程：
一、一部分实时，直接走MQ，到流式系统，作一些实时的分析，后写入HBase。
二、一部分写入HBase，通常是全量数据，后接入Hadoop/Spark，作一些离线分析，后续结果写入HBase中。
每每在使用HBase时，使用的rowkey设计是：设备ID+地点+xxx+时间xxx架构

每一个云公司，都在前端的一些环节作了不少事情，好比提供硬件支持、协议支持、ECS能够使用一些弹性方案，固然也有很多公司是本身作方案。
针对数据从云HBase到EMR Hadoop/Spark中，目前有两种方案，其一是Hadoop、Spark直接链接云HBase分析；其二是云HBase提供一些导出数据的功能，在EMR中自动生成一张表（目前云HBase在实现中）。oop

云数据库HBase免费申请地址：https://cn.aliyun.com/product/hbase设计