spark range join 优化

文章目录 背景 native join 解决方法 结论 参考 背景 一张ip表,一张ip地理信息表,地理信息表每条数据包含了ip地址的起点和终点以及一些地理信息, 须要用 ip 去关联 gep_ip 中匹配相应的信息 。python 例如: 数据条数为 50 M 的表 ip_record,数据格式大体以下:web ip_int info 123456789 xx 987654321 xx 数据条数
相关文章
相关标签/搜索