如何寻找无序数组中的第K大元素？

时间 2019-12-13

标签如何寻找无序数组元素繁體版

原文原文链接

如何寻找无序数组中的第K大元素？

有这样一个算法题：有一个无序数组，要求找出数组中的第K大元素。好比给定的无序数组以下所示：
java

若是k=6，也就是要寻找第6大的元素，很显然，数组中第一大元素是24，第二大元素是20，第三大元素是17...... 第六大元素是9。
算法

方法一：排序法

这是最容易想到的方法，先把无序数组从大到小进行排序，排序后的第k个元素天然就是数组中的第k大元素。可是这种方法的时间复杂度是O(nlogn),性能有些差。
数组

方法二：插入法

维护一个长度为k的数组A的有序数组，用于存储已知的K个较大的元素。而后遍历无序数组，每遍历到一个元素，和数组A中的最小元素进行比较，若是小于等于数组A中的最小元素，继续遍历;若是大于数组A中的最小元素，则插入到数组A中，并把曾经的最小元素"挤出去"。性能

好比K=3，先把最左侧的7,5,15三个数有序放入到数组A中，表明当前最大的三个数。
ui

此时，遍历到3时，因为3<5,继续遍历。
3d

接下来遍历到17，因为17>5,插入到数组A的合适位置，相似于插入排序，并把原先最小的元素5“挤出去”。
code

继续遍历原数组，一直遍历到数组的最后一个元素......blog

最终，数组A中存储的元素是24,20,17，表明着整个数组的最大的3个元素。此时数组A中的最小元素17就是咱们要寻找的第K大元素。
排序

这个方法的时间复杂度是O(nk)，可是若是K的值比较大的话，其性能可能还不如方法一。class

小顶堆法

二叉堆是一种特殊的彻底二叉树，它包含大顶堆和小顶堆两种形式。其中小顶堆的特色是每个父节点都小于等于本身的两个子节点。要解决这个算法题，咱们能够利用小顶堆的特性。

维护一个容量为K的小顶堆，堆中的K个节点表明着当前最大的K个元素，而堆顶显然是这K个元素中的最小值。
遍历原数组，每遍历一个元素，就和堆顶比较，若是当前元素小于等于堆顶，则继续遍历;若是元素大于堆顶，则把当前元素放在堆顶位置，并调整二叉堆（下沉操做）。
遍历结束后，堆顶就是数组的最大K个元素中的最小值，也就是第K大元素。

假设K=5，具体操做步骤以下：

1.把数组的前K个元素构建成堆

2.继续遍历数组，和堆顶比较，若是小于等于堆顶，则继续遍历;若是大于堆顶，则取代堆顶元素并调整堆。

遍历到元素2，因为2<3，因此继续遍历。

遍历到元素20，因为20>3,20取代堆顶位置，并调整堆。

遍历到元素24，因为24>5,24取代堆顶位置，并调整堆。

以此类推，咱们一个一个遍历元素，当遍历到最后一个元素8时，小顶堆的状况以下：

3.此时的堆顶，就是堆中的最小元素，也就是数组中的第K大元素。

这个方法的时间复杂度是多少呢？

1.构建堆的时间复杂度是O(K)
2.遍历剩余数组的时间复杂度O(n-K)
3.每次调整堆的时间复杂度是O(logk)
其中2和3是嵌套关系，1和2,3是并列关系，因此总的最坏时间复杂度是O((n-k)logk + k)。当k远小于n的状况下，也能够近似地认为是O(nlogk)。

这个方法的空间复杂度是多少呢？
刚才咱们在详细步骤中把二叉堆单独拿出来演示，是为了便于理解。但若是容许改变原数组的话，咱们能够把数组的前K个元素“原地交换”来构建成二叉堆，这样就免去了开辟额外的存储空间。所以空间复杂度是O(1)。

代码以下：

/**
     * 寻找第k大元素
     * @param array 待调整的数组
     * @param k 第几大
     * @return
     */
    public static int findNumberK(int[] array, int k) {
        //1.用前k个元素构建小顶堆
        buildHeap(array, k);
        //2.继续遍历数组，和堆顶比较
        for (int i = k; i < array.length; i++) {
            if(array[i] > array[0]) {
                array[0] = array[i];
                downAdjust(array, 0, k);
            }
        }
        //3.返回堆顶元素
        return array[0];
    }

    private static void buildHeap(int[] array, int length) {
        //从最后一个非叶子节点开始，依次下沉调整
        for (int i = (length - 2) / 2; i >= 0; i--) {
            downAdjust(array, i, length);
        }
    }

    /**
     * 下沉调整
     * @param array 待调整的堆
     * @param index 要下沉的节点
     * @param length 堆的有效大小
     */
    private static void downAdjust(int[] array, int index, int length) {
        //temp保存父节点的值，用于最后的赋值
        int temp = array[index];
        int childIndex = 2 * index + 1;
        while (childIndex < length) {
            //若是有右孩子，且右孩子小于左孩子的值，则定位到右孩子
            if (childIndex + 1 < length && array[childIndex + 1] < array[childIndex]) {
                childIndex++;
            }
            //若是父节点小于任何一个孩子的值，直接跳出
            if (temp <= array[childIndex])
                break;
            //无需真正交换，单项赋值便可
            array[index] = array[childIndex];
            index = childIndex;
            childIndex = 2 * childIndex + 1;
        }
        array[index] = temp;
    }

    public static void main(String[] args) {
        int[] array = new int[] {7, 5, 15, 3, 17, 2, 20, 24, 1, 9, 12, 8};
        System.out.println(findNumberK(array, 5));
    }

方法四：分治法

你们都了解快速排序，快速排序利用分治法，每一次把数组分红较大和较小元素两部分。咱们在寻找第K大元素的时候，也能够利用这个思路，以某个元素A为基准，把大于A的元素都交换到数组左边，小于A的元素交换到数组右边。

好比咱们选择以元素7做为基准，把数组分红了左侧较大，右侧较小的两个区域，交换结果以下：

包括元素7在内的较大元素有8个，但咱们的K=5，显然较大元素的数目过多了。因而咱们在较大元素的区域继续分治，此次以元素12为基准：

这样一来，包括元素12在内的较大元素有5个，正好和K相等。因此，基准元素12就是咱们所求的。

这就是分治法的思想，这种方法的时间复杂度甚至优于小顶堆法，能够达到O(n)。