Mysql 流增量写入 Hdfs(一) --从 mysql 到 kafka

一. 概述 在大数据的静态数据处理中,目前广泛采用的是用 Spark + Hdfs (Hive / Hbase) 的技术架构来对数据进行处理。mysql 但有时候有其余的需求,须要从其余不一样数据源不间断得采集数据,而后存储到 Hdfs 中进行处理。而追加(append)这种操做在 Hdfs 里面明显是比较麻烦的一件事。所幸有了 Storm 这么个流数据处理这样的东西问世,能够帮咱们解决这些问题。
相关文章
相关标签/搜索