冒泡排序是入门级的算法,但也有一些有趣的玩法。一般来讲,冒泡排序有三种写法:java
public static void bubbleSort(int[] arr) { for (int i = 0; i < arr.length - 1; i++) { for (int j = 0; j < arr.length - 1 - i; j++) { if (arr[j] > arr[j + 1]) { // 若是左边的数大于右边的数,则交换,保证右边的数字最大 swap(arr, j, j + 1); } } } } // 交换元素 private static void swap(int[] arr, int i, int j) { int temp = arr[i]; arr[i] = arr[j]; arr[j] = temp; }
最外层的 for 循环每通过一轮,剩余数字中的最大值就会被移动到当前轮次的最后一位,中途也会有一些相邻的数字通过交换变得有序。总共比较次数是 (n-1)+(n-2)+(n-3)+…+1(n−1)+(n−2)+(n−3)+…+1。
这种写法至关于相邻的数字两两比较,而且规定:“谁大谁站右边”。通过 n-1n−1 轮,数字就从小到大排序完成了。整个过程看起来就像一个个气泡不断上浮,这也是“冒泡排序法”名字的由来。算法
在第一种的基础上改良而来数组
public static void bubbleSort(int[] arr) { // 初始时 swapped 为 true,不然排序过程没法启动 boolean swapped = true; for (int i = 0; i < arr.length - 1; i++) { // 若是没有发生过交换,说明剩余部分已经有序,排序完成 if (!swapped) break; // 设置 swapped 为 false,若是发生交换,则将其置为 true swapped = false; for (int j = 0; j < arr.length - 1 - i; j++) { if (arr[j] > arr[j + 1]) { // 若是左边的数大于右边的数,则交换,保证右边的数字最大 swap(arr, j, j + 1); // 表示发生了交换 swapped = true; } } } } // 交换元素 private static void swap(int[] arr, int i, int j) { int temp = arr[i]; arr[i] = arr[j]; arr[j] = temp; }
最外层的 for 循环每通过一轮,剩余数字中的最大值仍然是被移动到当前轮次的最后一位。这种写法相对于第一种写法的优势是:若是一轮比较中没有发生过交换,则当即中止排序,由于此时剩余数字必定已经有序了。app
比较少见,在第二种的基础上进一步优化函数
public static void bubbleSort(int[] arr) { boolean swapped = true; // 最后一个没有通过排序的元素的下标 int indexOfLastUnsortedElement = arr.length - 1; // 上次发生交换的位置 int swappedIndex = -1; while (swapped) { swapped = false; for (int i = 0; i < indexOfLastUnsortedElement; i++) { if (arr[i] > arr[i + 1]) { // 若是左边的数大于右边的数,则交换,保证右边的数字最大 swap(arr, i, i + 1); // 表示发生了交换 swapped = true; // 更新交换的位置 swappedIndex = i; } } // 最后一个没有通过排序的元素的下标就是最后一次发生交换的位置 indexOfLastUnsortedElement = swappedIndex; } } // 交换元素 private static void swap(int[] arr, int i, int j) { int temp = arr[i]; arr[i] = arr[j]; arr[j] = temp; }
通过再一次的优化,代码看起来就稍微有点复杂了。最外层的 while 循环每通过一轮,剩余数字中的最大值仍然是被移动到当前轮次的最后一位。
在下一轮比较时,只需比较到上一轮比较中,最后一次发生交换的位置便可。由于后面的全部元素都没有发生过交换,必然已经有序了。
当一轮比较中从头至尾都没有发生过交换,则表示整个列表已经有序,排序完成。性能
空间复杂度为 O(1),时间复杂度为 O(n^2),
第二种、第三种冒泡排序因为通过优化,最好的状况下只须要 O(n)的时间复杂度。
最好状况:在数组已经有序的状况下,只需遍历一次,因为没有发生交换,排序结束。
最差状况:数组顺序为逆序,每次比较都会发生交换。
但优化后的冒泡排序平均时间复杂度仍然是 O(n^2),因此这些优化对算法的性能并无质的提高。优化
选择排序的思想是:双重循环遍历数组,每通过一轮比较,找到最小元素的下标,将其交换至首位。code
public static void selectionSort(int[] arr) { int minIndex; for (int i = 0; i < arr.length - 1; i++) { minIndex = i; for (int j = i + 1; j < arr.length; j++) { if (arr[minIndex] > arr[j]) { // 记录最小值的下标 minIndex = j; } } // 将最小元素交换至首位 int temp = arr[i]; arr[i] = arr[minIndex]; arr[minIndex] = temp; } }
冒泡排序和选择排序有什么异同?
相同点:对象
不一样点:排序
假定在待排序的记录序列中,存在多个具备相同的关键字的记录,若通过排序,这些记录的相对次序保持不变,即在原序列中,r[i] = r[j],且 r[i] 在 r[j] 以前,而在排序后的序列中,r[i] 仍在 r[j] 以前,则称这种排序算法是稳定的;不然称为不稳定的。
因此,
冒泡排序中,只有左边的数字大于右边的数字时才会发生交换,相等的数字之间不会发生交换,因此它是稳定的。
而选择排序中,最小值和首位交换的过程可能会破坏稳定性。好比数列:[2, 2, 1],在选择排序中第一次进行交换时,原数列中的两个 2 的相对顺序就被改变了,所以,咱们说选择排序是不稳定的
排序算法的稳定性有什么意义呢,其实它只在一种状况下有意义:当要排序的内容是一个对象的多个属性,且其本来的顺序存在乎义时,若是咱们须要在二次排序后保持原有排序的意义,就须要使用到稳定性的算法。
举个例子,若是咱们要对一组商品排序,商品存在两个属性:价格和销量。当咱们按照价格从高到低排序后,要再按照销量对其排序,这时,若是要保证销量相同的商品仍保持价格从高到低的顺序,就必须使用稳定性算法。
固然,算法的稳定性与具体的实现有关。在修改比较的条件后,稳定性排序算法可能会变成不稳定的。如冒泡算法中,若是将「左边的数大于右边的数,则交换」这个条件修改成「左边的数大于或等于右边的数,则交换」,冒泡算法就变得不稳定了。
一样地,不稳定排序算法也能够通过修改,达到稳定的效果。思考一下,选择排序算法如何实现稳定排序呢?
实现的方式有不少种,这里给出一种最简单的思路:新开一个数组,将每轮找出的最小值依次添加到新数组中,选择排序算法就变成稳定的了。
但若是将寻找最小值的比较条件由arr[minIndex] > arr[j]修改成arr[minIndex] >= arr[j],即便新开一个数组,选择排序算法依旧是不稳定的。因此分析算法的稳定性时,须要结合具体的实现逻辑才能得出结论,咱们一般所说的算法稳定性是基于通常实现而言的。
既然每轮遍历时找出了最小值,何不把最大值也顺便找出来呢?这就是二元选择排序的思想。
使用二元选择排序,每轮选择时记录最小值和最大值,能够把数组须要遍历的范围缩小一倍。
public static void selectionSort2(int[] arr) { int minIndex, maxIndex; // i 只须要遍历一半 for (int i = 0; i < arr.length / 2; i++) { minIndex = i; maxIndex = i; for (int j = i + 1; j < arr.length - i; j++) { if (arr[minIndex] > arr[j]) { // 记录最小值的下标 minIndex = j; } if (arr[maxIndex] < arr[j]) { // 记录最大值的下标 maxIndex = j; } } // 若是 minIndex 和 maxIndex 都相等,那么他们一定都等于 i,且后面的全部数字都与 arr[i] 相等,此时已经排序完成 if (minIndex == maxIndex) break; // 将最小元素交换至首位 int temp = arr[i]; arr[i] = arr[minIndex]; arr[minIndex] = temp; // 若是最大值的下标恰好是 i,因为 arr[i] 和 arr[minIndex] 已经交换了,因此这里要更新 maxIndex 的值。 if (maxIndex == i) maxIndex = minIndex; // 将最大元素交换至末尾 int lastIndex = arr.length - 1 - i; temp = arr[lastIndex]; arr[lastIndex] = arr[maxIndex]; arr[maxIndex] = temp; } }
咱们使用 minIndex 记录最小值的下标,maxIndex 记录最大值的下标。每次遍历后,将最小值交换到首位,最大值交换到末尾,就完成了排序。
因为每一轮遍历能够排好两个数字,因此最外层的遍历只需遍历一半便可。
二元选择排序中有一句很重要的代码,它位于交换最小值和交换最大值的代码中间:
if (maxIndex == i) maxIndex = minIndex;
这行代码的做用处理了一种特殊状况:若是最大值的下标等于 i,也就是说 arr[i] 就是最大值,因为 arr[i] 是当前遍历轮次的首位,它已经和 arr[minIndex] 交换了,因此最大值的下标须要跟踪到 arr[i] 最新的下标 minIndex。
在二元选择排序算法中,数组须要遍历的范围缩小了一倍。那么这样可使选择排序的效率提高一倍吗?
从代码能够看出,虽然二元选择排序最外层的遍历范围缩小了,但 for 循环内作的事情翻了一倍。也就是说二元选择排序没法将选择排序的效率提高一倍。但实测会发现二元选择排序的速度确实比选择排序的速度快一点点,它的速度提高主要是由于两点:
前文已经说到,选择排序使用两层循环,时间复杂度为 O(n^2); 只使用有限个变量,空间复杂度 O(1)。二元选择排序虽然比选择排序要快,但治标不治本,二元选择排序中作的优化没法改变其时间复杂度,二元选择排序的时间复杂度仍然是 O(n^2);只使用有限个变量,空间复杂度 O(1)。
插入排序的思想很是简单,生活中有一个很常见的场景:在打扑克牌时,咱们一边抓牌一边给扑克牌排序,每次摸一张牌,就将它插入手上已有的牌中合适的位置,逐渐完成整个排序。
插入排序有两种写法:
public static void insertSort(int[] arr) { // 从第二个数开始,往前插入数字 for (int i = 1; i < arr.length; i++) { // j 记录当前数字下标 int j = i; // 当前数字比前一个数字小,则将当前数字与前一个数字交换 while (j >= 1 && arr[j] < arr[j - 1]) { swap(arr, j, j - 1); // 更新当前数字下标 j--; } } } private static void swap(int[] arr, int i, int j) { int temp = arr[i]; arr[i] = arr[j]; arr[j] = temp; }
当数字少于两个时,不存在排序问题,固然也不须要插入,因此咱们直接从第二个数字开始往前插入。
整个过程就像是已经有一些数字坐成了一排,这时一个新的数字要加入,这个新加入的数字本来坐在这一排数字的最后一位,而后它不断地与前面的数字比较,若是前面的数字比它大,它就和前面的数字交换位置。
能够发现,在交换法插入排序中,每次交换数字时,swap 函数都会进行三次赋值操做。但实际上,新插入的这个数字并不必定适合与它交换的数字所在的位置。也就是说,它刚换到新的位置上不久,下一次比较后,若是又须要交换,它立刻又会被换到前一个数字的位置。
由此,咱们能够想到一种优化方案:让新插入的数字先进行比较,前面比它大的数字不断向后移动,直到找到适合这个新数字的位置后,新数字只作一次插入操做便可。
这种方案咱们须要把新插入的数字暂存起来,代码以下:
public static void insertSort(int[] arr) { // 从第二个数开始,往前插入数字 for (int i = 1; i < arr.length; i++) { int currentNumber = arr[i]; int j = i - 1; // 寻找插入位置的过程当中,不断地将比 currentNumber 大的数字向后挪 while (j >= 0 && currentNumber < arr[j]) { arr[j + 1] = arr[j]; j--; } // 两种状况会跳出循环:1. 遇到一个小于或等于 currentNumber 的数字,跳出循环,currentNumber 就坐到它后面。 // 2. 已经走到数列头部,仍然没有遇到小于或等于 currentNumber 的数字,也会跳出循环,此时 j 等于 -1,currentNumber 就坐到数列头部。 arr[j + 1] = currentNumber; } }
整个过程就像是已经有一些数字坐成了一排,这时一个新的数字要加入,因此这一排数字不断地向后腾出位置,当新的数字找到本身合适的位置后,就能够直接坐下了。重复此过程,直到排序结束。
分析可知,插入排序的过程不会破坏原有数组中相同关键字的相对次序,因此插入排序是一种稳定的排序算法。
插入排序过程须要两层循环,时间复杂度为 O(n^2);只须要常量级的临时变量,空间复杂度为 O(1)。
本章咱们介绍了三种基础排序算法:冒泡排序、选择排序、插入排序。
冒泡排序有两种优化方式:
选择排序能够演变为二元选择排序:
插入排序有两种写法: