Hadoop实战之课后题--分析web服务器的日志文件

全部代码:github-wtttttjava 任务 统计每一个IP地址的访问次数 查找访问数最多的前K个IP地址 分析: 任务1很简单,简单的求和问题,用来从新熟悉hadoop MR程序的写法。 优化:使用combiner()减小网络中的流量传输; 这个例子中combiner和reducer的逻辑相同,两种使用同一个reduce便可。 代码贴在附录里了,注释详细,可查看~ 任务2是一个TopK的问
相关文章
相关标签/搜索