sqoop-import 并行抽数及数据倾斜解决

最近在数据中台的数据抽数优化工作,由于单表数据量太大(每天千万级别)导致sqoop抽数使用单实例报内存溢出以及抽数时间过长,决定采用sqoop的多实例并行抽数,参考了一些文档,但同时遇到了一些问题,趁有点时间把遇到问题的解决方法写下来供大家借鉴。  并行化 sqoop-常用命令及参数:https://www.yuque.com/shanyu-aqvcy/hkqgb7/vngsox sqoop 抽数
相关文章
相关标签/搜索