利用Hadoop Streaming处理二进制格式文件

Hadoop Streaming是Hadoop提供的多语言编程工具,用户可使用本身擅长的编程语言(好比python、php或C#等)编写Mapper和Reducer处理文本数据。Hadoop Streaming自带了一些配置参数可友好地支持多字段文本数据的处理,参与Hadoop Streaming介绍和编程,可参考个人这篇文章: “Hadoop Streaming编程实例” 。然而,随着Hadoo
相关文章
相关标签/搜索