hadoop,hive,MapReduce,调度器,项目总结及性能优化

hadoop 的性能优化   MapReduce   调度器   MapReduce中实现join   MapReduce Join map join:适合小文件和大文件的join        Join过程发生在Map端        每个Map  task都可以直接读取到小文件内容 与大文件的每一个块进行join.        分布式join        小文件:文件大小 < 1个块的大小
相关文章
相关标签/搜索