【JDK优化】java.util.Arrays的排序研究

时间 2019-11-12

标签 JDK优化 java.util.arrays java util arrays 排序研究栏目 Java 繁體版

原文原文链接

【java.uti.Arrays】 包含用来操做数组（好比排序和搜索）的各类方法。这篇文章咱们就来研究一些大师们写的排序算法。java

(1) 基本数据类型数组的排序，如Arrays.sort(int[])等。采用了一种经 过调优的快速排序 。该算法改编自 Jon L. Bentley 和 M. Douglas McIlroy 合著的 Engineering a Sort Function", Software-Practice and Experience Vol. 23(11) P. 1249-1265 (November 1993)。此算法在许多数据集上提供 n*log(n) 性能，这致使其余快速排序会下降二次型性能。算法

下面是JDK中调优快速排序算法的源代码数组

   /**
     * 将指定范围的整形数组升序排序。
     * x[] 待排数组
     * off 从数组的第off个元素开始排序
     * len 数组长度
     */
    private static void sort1(int x[], int off, int len) {
	//优化1：在小规模(size<7)数组中，直接插入排序的效率要比快速排序高。
	if (len < 7) {
	    for (int i=off; i<len+off; i++)
	    	for (int j=i; j>off && x[j-1]>x[j]; j--)
	    		swap(x, j, j-1);
	    return;
	}

	//优化2：精心选择划分元素，即枢轴
	//若是是小规模数组(size<=7)，直接取中间元素做为枢轴
	//若是是中等规模数组(7=<size<=40)，则在数组首、中、尾三个位置上的数中取中间大小的数做为枢轴
	//若是是大规模数组(size>40),则在9个指定的数中取一个伪中数(中间大小的数s)
	int m = off + (len >> 1);
	if (len > 7) { 
	    int l = off;
	    int n = off + len - 1;
	    if (len > 40) {        
			int s = len/8;
			l = med3(x, l, l+s, l+2*s);
			m = med3(x, m-s,   m,   m+s);
			n = med3(x, n-2*s, n-s, n);
	    }
	    m = med3(x, l, m, n);
	}
	int v = x[m];

         //优化3：每一次枢轴v的划分，都会造成造成一个形如  (<v)* v* (>v)*
        //阶段一，造成 v* (<v)* (>v)* v* 的数组
        int a = off, b = a, c = off + len - 1, d = c;
        while(true) {
	    while (b <= c && x[b] <= v) {
			if (x[b] == v)
			    swap(x, a++, b);
			b++;
	    }
	    while (c >= b && x[c] >= v) {
			if (x[c] == v)
			    swap(x, c, d--);
			c--;
	    }
	    if (b > c)
	    	break;
	    swap(x, b++, c--);
	}

	//阶段二，将枢轴和与枢轴相等的元素交换到数组中间
	int s, n = off + len;
	s = Math.min(a-off, b-a  );  vecswap(x, off, b-s, s);
	s = Math.min(d-c,   n-d-1);  vecswap(x, b,   n-s, s);

	//阶段三，递归排序与枢轴不相等都元素区间
	if ((s = b-a) > 1)
	    sort1(x, off, s);
	if ((s = d-c) > 1)
	    sort1(x, n-s, s);
    }

★ 优化1：在小规模(size<7)数组中，直接插入排序的效率要比快速排序高。性能

没有一种排序在任何状况下都是最优的《基于比较的内部排序总结》。 O(N^2)级别的排序看起来彷佛比全部先进排序要差的多。但实际上也并不是如此，Arrays中的sort()算法就给了咱们一个很好的例子。当待排数组规模很是小的时候(JDK中规模的阈值为INSERTIONSORT_THRESHOLD=7)，直接插入排序反而要比快排，归并排序要好。优化

这个道理很简单。数组规模小，简单算法的比较次数不会比先进算法多多少。相反，诸如快排，归并排序等先进算法使用递归操做，所付出的运行代价更高。spa

★ 优化2：精心选择划分元素，即枢轴。code

快排有一种最差的状况，即蜕化成效率最差的起跑排序(见《交换排序》)。致使这种状况产生的主要缘由就是枢轴的选择并不能把整个数组划分红两个大体相等的部分。好比对于基本有序的数组，选择第一个元素做为枢轴就会产生这种蜕化。对象

既然如此，咱们能够看看Arryas.sort()是如何为咱们选择枢轴的。blog

● 若是是小规模数组(size<=7)，直接取中间元素做为枢轴。排序

● 若是是中等规模数组(7=<size<=40)，则在数组首、中、尾三个位置上的数中取中间大小的数做为枢轴
● 若是是大规模数组(size>40),则在9个指定的数中取一个伪中数(中间大小的数s)

中小规模时，这种取法尽可能能够避免数组的较小数或者较大数成为枢轴。值得一提的是大规模的时候，首先在数组中寻找9个数据(能够经过源代码发现这9个数据的位置较为平均的分布在整个数组上)；而后每3个数据找中位数；最后在3个中位数上再找出一个中位数做为枢轴。

仔细想一想，这种精心选择的枢轴，使得快排的最差状况成为了极小几率事件了。

★ 优化3：根据枢轴v划分，造成一个形如 (<v)* v* (>v)* 的数组

普通快排算法，都是使得枢轴元素移动到数组的较中间位置。枢轴以前的元素所有小于或等于枢轴，以后的元素所有大于枢轴。但与枢轴相等的元素并不能移动到枢轴附近位置。这一点在Arrays.sort()算法中有很大的优化。

咱们举个例子来讲明Arrays的优化细节 1五、9三、1五、4一、六、1五、2二、七、1五、20

第一次枢轴：v=15

阶段一，造成 v* (<v)* (>v)* v* 的数组：

1五、1五、七、六、 4一、20、2二、9三、 1五、15

咱们发现，与枢轴相等的元素都移动到了数组的两边。而比枢轴小的元素和比枢轴大的元素也都区分开来了。

阶段二，将枢轴和与枢轴相等的元素交换到数组中间的位置上

七、六、 1五、1五、 1五、1五、 4一、20、2二、93

阶段三，递归排序与枢轴不相等都元素区间{七、6}和{4一、20、2二、93}

仔细想一想，对于重复元素较多的数组，这种优化无疑能到达更好的效率。

(1) 对象数组的排序，如Arrays.sort(Object[])等。采用了一种经 过修改的归并排序 。其也有几个优化的闪光点。

下面是JDK中改进归并排序算法的源代码：

    /**
     * 将指定范围的对象数组按天然顺序升序排序。
     * src[] 原待排数组
     * dest[] 目的待排数组
     * low 待排数组的下界位置
     * high 待排数组的上界位置
     * off 从数组的第off个元素开始排序
     */    
    private static void mergeSort(Object[] src,
				  Object[] dest,
				  int low,
				  int high,
				  int off) {
	int length = high - low;

	//优化1：规模很小的数组的排序，直接插入排序的效率反而比归并要高。
	//规模定在INSERTIONSORT_THRESHOLD=7以内
        if (length < INSERTIONSORT_THRESHOLD) {
            for (int i=low; i<high; i++)
                for (int j=i; j>low &&
			 ((Comparable) dest[j-1]).compareTo(dest[j])>0; j--)
                    swap(dest, j, j-1);
            return;
        }

        // 递归排序dest的一半元素并赋值给src
        int destLow  = low;
        int destHigh = high;
        low  += off;
        high += off;
        int mid = (low + high) >> 1;
        mergeSort(dest, src, low, mid, -off);
        mergeSort(dest, src, mid, high, -off);

        //优化2：若是低子列表中的最高元素小于高子列表中的最低元素，则忽略合并        
        //若是须要归并的两端low~(middle-1)，middle~high已经有序，即src[mid-1]==src[mid]。
        //那么只须要将src的low~high赋值对应的dest便可，无需再归并。
        if (((Comparable)src[mid-1]).compareTo(src[mid]) <= 0) {
            System.arraycopy(src, low, dest, destLow, length);
            return;
        }

        //将src的两个部分合并，并赋值给dest
        for(int i = destLow, p = low, q = mid; i < destHigh; i++) {
            if (q >= high || p < mid && ((Comparable)src[p]).compareTo(src[q])<=0)
                dest[i] = src[p++];
            else
                dest[i] = src[q++];
        }
    }

★ 优化1：同上面的快速排序

★ 优化2：若是低子列表中的最高元素小于高子列表中的最低元素，则忽略合并。这个优化措施无疑对基本有序序列是极大的效率改进。