大数据系列(三)以日志为例,利用hadoop原生hdfs和MapReduce分别进行统计

目录 使用java操做hdfs的api hdfs写入数据的流程 利用hdfs来实现词频统计 使用MapReduce 使用MR来作wordcount 使用MR进行本地计算 使用MR来统计日志 扩展之使用NullWritable来忽略key 扩展之设置分区来写入不一样文件 附上代码仓库 使用java操做hdfs的api 咱们来写几个demo,测试一下api:java package zl.hdfs;
相关文章
相关标签/搜索