MapReduce的join操做,代码实现

MapJoin MapJoin主要适用于一个大表和小表的关联,若是两张都是大表则会形成数据读取混乱,不适合用MapJoin处理。 MapJoin处理原理:将小表读入到内存中,而后用map方法将大表中的数据一一读取,并和内存中的小表进行数据匹配。由于是在map环节中进行了join操做,因此此作法能够有效提升reduce的运行效率。 两张表: 物品类型表: 物品表: 我这里是新建的Excel表,最后保
相关文章
相关标签/搜索