Flume+Spark+Hive+Spark SQL离线分析系统

前段时间把Scala和Spark一块儿学习了,因此借此机会在这里作个总结,顺便和你们一块儿分享一下目前最火的分布式计算技术Spark!固然Spark不光是能够作离线计算,还提供了许多功能强大的组件,好比说,Spark Streaming 组件作实时计算,和Kafka等消息系统也有很好的兼容性;Spark Sql,可让用户经过标准SQL语句操做从不一样的数据源中过来的结构化数据;还提供了种类丰富的M
相关文章
相关标签/搜索