黑猴子的家:Hive 优化之 JVM 重用

JVM重用是Hadoop调优参数的内容,其对Hive的性能具备很是大的影响,特别是对于很难避免小文件的场景或task特别多的场景,这类场景大多数执行时间都很短。jvm Hadoop的默认配置一般是使用派生JVM来执行map和Reduce任务的。这时JVM的启动过程可能会形成至关大的开销,尤为是执行的job包含有成百上千task任务的状况。JVM重用能够使得JVM实例在同一个job中从新使用N次。N
相关文章
相关标签/搜索