大数据系列（三）以日志为例，利用hadoop原生hdfs和MapReduce分别进行统计

时间 2019-12-07

标签数据系列日志为例利用 hadoop 原生 hdfs mapreduce 分别进行统计栏目 Hadoop 繁體版

原文原文链接

目录使用java操做hdfs的api hdfs写入数据的流程利用hdfs来实现词频统计使用MapReduce 使用MR来作wordcount 使用MR进行本地计算使用MR来统计日志扩展之使用NullWritable来忽略key 扩展之设置分区来写入不一样文件附上代码仓库使用java操做hdfs的api 咱们来写几个demo，测试一下api：java package zl.hdfs;

>>阅读原文<<