Spark与HBase的整合

时间 2019-12-07

标签 spark hbase 整合栏目 Spark 繁體版

原文原文链接

前言以前由于仅仅是把HBase当成一个可横向扩展而且具备持久化能力的KV数据库，因此只用在了指标存储上，参看很早以前的一篇文章基于HBase作Storm 实时计算指标存储。此次将HBase用在了用户行为存储上，由于Rowkey的过滤功能也很不错，能够很方便的把按人或者内容的维度过滤出全部的行为。从某种意义上，HBase的是一个有且仅有一个多字段复合索引的存储引擎。git 虽然我比较推崇实时计算，

>>阅读原文<<