自动化HDFS数据复制机制的简单方法!

到目前为止,我们已经看到了从HDFS复制数据的不同选择。大多数机制没有自动化或调度功能,不过是用于访问数据的低级方法。如果希望自动化数据副本,可以将其中一种低级技术包含在调度引擎(如cron或Quartz)中。但是,如果正在寻找开箱即用的自动化工具,本节很适合你阅读。 在本章的前半部分,我们研究了两种可以将半结构化和二进制数据转换为HDFS的机制:开源HDFS File Slurper项目和Ooz
相关文章
相关标签/搜索