Spark与HBase的整合

前言 以前由于仅仅是把HBase当成一个可横向扩展而且具备持久化能力的KV数据库,因此只用在了指标存储上,参看很早以前的一篇文章基于HBase作Storm 实时计算指标存储。此次将HBase用在了用户行为存储上,由于Rowkey的过滤功能也很不错,能够很方便的把按人或者内容的维度过滤出全部的行为。从某种意义上,HBase的是一个有且仅有一个多字段复合索引的存储引擎。git 虽然我比较推崇实时计算,
相关文章
相关标签/搜索