kettle是使用java开发的,主要运行在jvm上,这样它的执行效率就和jvm的调优有关了,我在平时的使用中,主要是用kitchen.sh(其实其它的*.sh也是同样的),在默认的状况下内存的使用配置是这样的java
# ****************************************************************** # ** Set java runtime options ** # ** Change 512m to higher values in case you run out of memory ** # ** or set the PENTAHO_DI_JAVA_OPTIONS environment variable ** # ** (JAVAMAXMEM is there for compatibility reasons) ** # ****************************************************************** if [ -z "$JAVAMAXMEM" ]; then JAVAMAXMEM="512" fi if [ -z "$PENTAHO_DI_JAVA_OPTIONS" ]; then PENTAHO_DI_JAVA_OPTIONS="-Xmx${JAVAMAXMEM}m" fi
为了能让kettle更好的运行,我修改为了这样jvm
# ****************************************************************** # ** Set java runtime options ** # ** Change 512m to higher values in case you run out of memory ** # ** or set the PENTAHO_DI_JAVA_OPTIONS environment variable ** # ** (JAVAMAXMEM is there for compatibility reasons) ** # ****************************************************************** if [ -z "$JAVAMAXMEM" ]; then JAVAMAXMEM="16384" fi if [ -z "$PENTAHO_DI_JAVA_OPTIONS" ]; then PENTAHO_DI_JAVA_OPTIONS="-Xms${JAVAMAXMEM}m -Xmx${JAVAMAXMEM}m -Xss1024m" fi
能够看到,首先我加大了xmx,其次我添加了xms和xss,这是为何呢?xss
将xms调整到与xmx同样,是为了让jvm在GC后,不要再进行内存分配,直接使用指定的值,这样省去了计算并分配内存的时间,而添加xss是为了让kettle在单次Job中执行更多更深刻的循环,若是没有大的循环能够不用配置xss,由于jvm在起线程的时候每一个线程都会分配xss指定大小的内存,也就是说xss越大,可用的线程就越少,这点是须要注意的!优化
修改完成后,从内存的监控图中能够看出,内存的分配和回收所造成的图形是相似"WW"形的,直上直下,执行时间也明显的比修改前少了。线程
好了,就先到这儿,若是还有其它方面的优化,我会再和你们分享的。
code