hive学习笔记之map-side joins

在分布式计算框架中,其实表链接这类操做都是须要跨节点的,因此计算效率都比较慢。hive也是如此,针对表链接,hive在大表与小表进行链接时有个优化常用,就是map-side join。框架 好比:分布式 select  /*+ mapjoin(u)*/  u.user_id,l.time  from user u join opera_log l on u.user_id=l.user_id wh
相关文章
相关标签/搜索