Hive-1.1.0的注意事项之transform的坑

曾经为贪图方便使用Hive的tranform来实现了一些对数据的处理逻辑,可是以后发现各类坑啊,,,,,,以下:       经过大量的数据实验发现:在数据清洗过程当中,若是使用的是TransForm而不是UDF的话,由于Python是直接向系统申请资源的,而不是像ResourceManager申请资源,故会致使启动的Python脚本对内存和CPU的使用不可控,尤为是当启动多个Map时,由于一个m
相关文章
相关标签/搜索