Hadoop数据收集与入库系统Flume与Sqoop

Hadoop提供了一个中央化的存储系统,其有利于进行集中式的数据分析与数据共享。 hadoop对存储格式没有要求。可以存储用户访问日志、产品信息以及网页数据等数据。        常见的两种数据来源。一种是分散的数据源:机器产生的数据、用户访问日志以及用户购买日志。另一种是传统系统中的数据:传统关系型数据库(MySQL、Oracle)、磁盘阵列以及磁带。         Flume由三部分构成。M
相关文章
相关标签/搜索