现现在大学生学习排序算法,除了学习它的算法原理、代码实现以外,做为一个大学生更重要的每每是要学会如何评价、分析一个排序算法。排序对于任何一个程序员来讲,可能都不会陌生。大部分编程语言中,也都提供了排序函数。在日常的项目中,咱们也常常会用到排序。排序很是重要!本章主要从如何分析一个算法开始入手,从而循进渐进的分析那些大学四年结束以前必须掌握的排序算法! @[toc]java
固然你能够先思考一两分钟,带着这个问题,咱们开始以下的内容!<font color=red>而且注意我标红的字体,每每是起眼或者不起眼的重点。</font>程序员
对于排序算法执行效率的分析,咱们通常会从这三个方面来衡量:算法
咱们在分析排序算法的时间复杂度时,要分别给出最好状况、最坏状况、平均状况下的时间复杂度。除此以外,你还要说出最好、最坏时间复杂度对应的要排序的原始数据是什么样的。shell
为何要区分这三种时间复杂度呢?第一,有些排序算法会区分,为了好对比,因此咱们最好都作一下区分。第二,对于要排序的数据,有的接近有序,有的彻底无序。有序度不一样的数据,对于排序的执行时间确定是有影响的,咱们要知道排序算法在不一样数据下的性能表现。编程
咱们知道,时间复杂度反应的是数据规模n很大的时候的一个增加趋势,因此它表示的时候会忽略系数、常数、低阶。可是实际的软件开发中,咱们排序的多是10个、100个、1000个这样规模很小的数据,因此,在对同一阶时间复杂度的排序算法性能对比的时候,咱们就要把系数、常数、低阶也考虑进来。api
这一节和下一节讲的都是基于比较的排序算法。基于比较的排序算法的执行过程,会涉及两种操做,一种是元素比较大小,另外一种是元素交换或移动。因此,若是咱们在分析排序算法的执行效率的时候,应该把比较次数和交换(或移动)次数也考虑进去。数组
咱们前面讲过,算法的内存消耗能够经过空间复杂度来衡量,排序算法也不例外。不过,针对排序算法的空间复杂度,咱们还引入了一个新的概念,原地排序(Sorted in place)。原地排序算法,就是特指空间复杂度是O(1)的排序算法。性能优化
稳定性千万不要忽略,仅仅用执行效率和内存消耗来衡量排序算法的好坏是不够的。针对排序算法,咱们还有一个重要的度量指标,稳定性。这个概念是说,若是待排序的序列中存在值相等的元素,通过排序以后,相等元素之间原有的前后顺序不变。数据结构
我经过一个例子来解释一下。好比咱们有一组数据2,9,3,4,8,3,按照大小排序以后就是2,3,3,4,8,9。 这组数据里有两个3。通过某种排序算法排序以后,若是两个3的先后顺序没有改变,那咱们就把这种排序算法叫做稳定的排序算法;若是先后顺序发生变化,那对应的排序算法就叫做不稳定的排序算法。数据结构和算法
你可能要问了,两个3哪一个在前,哪一个在后有什么关系啊,稳不稳定又有什么关系呢?为何要考察排序算法的稳定性呢?
不少数据结构和算法课程,在讲排序的时候,都是用整数来举例,但在真正软件开发中,咱们要排序的每每不是单纯的整数,而是一组对象,咱们须要按照对象的某个key来排序。
好比说,咱们如今要给电商交易系统中的“订单”排序。订单有两个属性,一个是下单时间,另外一个是订单金额。若是咱们如今有10万条订单数据,咱们但愿按照金额从小到大对订单数据排序。对于金额相同的订单,咱们但愿按照下单时间从早到晚有序。对于这样一个排序需求,咱们怎么来作呢?
最早想到的方法是:咱们先按照金额对订单数据进行排序,而后,再遍历排序以后的订单数据,对于每一个金额相同的小区间再按照下单时间排序。这种排序思路理解起来不难,可是实现起来会很复杂。
借助稳定排序算法,这个问题能够很是简洁地解决。解决思路是这样的:咱们先按照下单时间给订单排序,注意是按照下单时间,不是金额。排序完成以后,咱们用稳定排序算法,按照订单金额从新排序。两遍排序以后,咱们获得的订单数据就是按照金额从小到大排序,金额相同的订单按照下单时间从早到晚排序的。为何呢?
<font color=red>稳定排序算法能够保持金额相同的两个对象,在排序以后的先后顺序不变</font>。第一次排序以后,全部的订单按照下单时间从早到晚有序了。在第二次排序中,咱们用的是稳定的排序算法,因此通过第二次排序以后,相同金额的订单仍然保持下单时间从早到晚有序。
到这里,分析一个“排序算法”就结束了,你get到了吗?接下来,咱们进入实战算法分析。
冒泡排序描述:冒泡排序只会操做相邻的两个数据。每次冒泡操做都会对相邻的两个元素进行比较,看是否知足大小关系要求。若是不知足就让它俩互换。一次冒泡会让至少一个元素移动到它应该在的位置,重复n次,就完成了n个数据的排序工做。
若是仍是不能一眼看出其灵魂,没事,我还有一招:
怎么样,够不够直观,就是有点慢,哈哈~
package BubbleSort; import java.util.Arrays; public class generalBubble { public static void main(String[] args) { int[] arr=new int[] {5,7,2,9,4,1,0,5,8,7}; System.out.println(Arrays.toString(arr)); bubbleSort(arr); System.out.println(Arrays.toString(arr)); } //冒泡排序 public static void bubbleSort(int[] arr) { //控制共比较多少轮 for(int i=0;i<arr.length-1;i++) { //控制比较的次数 for(int j=0;j<arr.length-1-i;j++) { if(arr[j]>arr[j+1]) { int temp=arr[j]; arr[j]=arr[j+1]; arr[j+1]=temp; } } } } }
测试效果:
实际上,刚讲的冒泡过程还能够优化。当某次冒泡操做已经没有数据交换时,说明已经达到彻底有序,不用再继续执行后续的冒泡操做。我这里还有另一个例子,这里面给6个元素排序,只须要4次冒泡操做就能够了。
// 冒泡排序,a表示数组,n表示数组大小 public void bubbleSort(int[] a, int n) { if (n <= 1) return; for (int i = 0; i < n; ++i) { // 提早退出冒泡循环的标志位 boolean flag = false; for (int j = 0; j < n - i - 1; ++j) { if (a[j] > a[j+1]) { // 交换 int tmp = a[j]; a[j] = a[j+1]; a[j+1] = tmp; flag = true; // 表示有数据交换 } } if (!flag) break; // 没有数据交换,提早退出 } }
如今,结合刚才我分析排序算法的三个方面,开始分析冒泡排序算法。
首先,原地排序算法就是特指空间复杂度是O(1)的排序算法,我在上文说起过的,再提一遍(我猜大家确定没仔细看文章。。。)
冒泡的过程只涉及相邻数据的交换操做,只须要常量级的临时空间,因此它的空间复杂度为O(1),是一个原地排序算法。
在冒泡排序中,只有交换才能够改变两个元素的先后顺序。为了保证冒泡排序算法的稳定性,当有相邻的两个元素大小相等的时候,咱们不作交换,相同大小的数据在排序先后不会改变顺序,因此冒泡排序是稳定的排序算法。
最好状况下,要排序的数据已是有序的了,咱们只须要进行一次冒泡操做,就能够结束了,因此最好状况时间复杂度是O(n)。而最坏的状况是,要排序的数据恰好是倒序排列的,咱们须要进行n次冒泡操做,因此最坏状况时间复杂度为O(n2),平均状况下的时间复杂度就是O(n2)。
插入排序(Insertion-Sort)的算法描述是一种简单直观的排序算法。它的工做原理是经过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。插入排序在实现上,一般采用in-place排序(即只需用到O(1)的额外空间的排序),于是在从后向前扫描过程当中,须要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。
一样,我也准备了数字版的,是否是很贴心?
public class InsertSort { public static void main(String[] args) { int[] arr = new int[] {5,3,2,8,5,9,1,0}; insertSort(arr); System.out.println(Arrays.toString(arr)); } //插入排序 public static void insertSort(int[] arr) { //遍历全部的数字 for(int i=1;i<arr.length;i++) { //若是当前数字比前一个数字小 if(arr[i]<arr[i-1]) { //把当前遍历数字存起来 int temp=arr[i]; int j; //遍历当前数字前面全部的数字 for(j=i-1;j>=0&&temp<arr[j];j--) { //把前一个数字赋给后一个数字 arr[j+1]=arr[j]; } //把临时变量(外层for循环的当前元素)赋给不知足条件的后一个元素 arr[j+1]=temp; } } } }
如今,结合刚才我分析排序算法的三个方面,开始分析插入排序算法。
从实现过程能够很明显地看出,插入排序算法的运行并不须要额外的存储空间,因此空间复杂度是O(1),也就是说,这是一个原地排序算法。
在插入排序中,对于值相同的元素,咱们能够选择将后面出现的元素,插入到前面出现元素的后面,这样就能够保持原有的先后顺序不变,因此插入排序是稳定的排序算法。
若是要排序的数据已是有序的,咱们并不须要搬移任何数据。若是咱们从尾到头在有序数据组里面查找插入位置,每次只须要比较一个数据就能肯定插入的位置。因此这种状况下,最好是时间复杂度为O(n)。注意,这里是从尾到头遍历已经有序的数据。
若是数组是倒序的,每次插入都至关于在数组的第一个位置插入新的数据,因此须要移动大量的数据,因此最坏状况时间复杂度为O(n2)。
还记得咱们在数组中插入一个数据的平均时间复杂度是多少吗?没错,是O(n)。因此,对于插入排序来讲,每次插入操做都至关于在数组中插入一个数据,循环执行n次插入操做,因此平均时间复杂度为O(n2)。
选择排序(Selection sort)是一种简单直观的排序算法。它的工做原理是:第一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,而后再从剩余的未排序元素中寻找到最小(大)元素,而后放到已排序的序列的末尾。以此类推,直到所有待排序的数据元素的个数为零。选择排序是不稳定的排序方法。
public class SelectSort { public static void main(String[] args) { int[] arr = new int[] {3,4,5,7,1,2,0,3,6,8}; selectSort(arr); System.out.println(Arrays.toString(arr)); } //选择排序 public static void selectSort(int[] arr) { //遍历全部的数 for(int i=0;i<arr.length;i++) { int minIndex=i; //把当前遍历的数和后面全部的数依次进行比较,并记录下最小的数的下标 for(int j=i+1;j<arr.length;j++) { //若是后面比较的数比记录的最小的数小。 if(arr[minIndex]>arr[j]) { //记录下最小的那个数的下标 minIndex=j; } } //若是最小的数和当前遍历数的下标不一致,说明下标为minIndex的数比当前遍历的数更小。 if(i!=minIndex) { int temp=arr[i]; arr[i]=arr[minIndex]; arr[minIndex]=temp; } } } }
选择排序算法是一种原地、不稳定的排序算法,最好时间复杂度状况:T(n) = O(n2) 最差时间复杂度状况:T(n) = O(n2) 平均时间复杂度状况:T(n) = O(n2)
希尔排序也是一种插入排序,它是简单插入排序通过改进以后的一个更高效的版本,也称为缩小增量排序,同时该算法是冲破O(n2)的第一批算法之一。它与插入排序的不一样之处在于,它会优先比较距离较远的元素。希尔排序又叫缩小增量排序。希尔排序是把记录按下表的必定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减小,每组包含的关键词愈来愈多,当增量减至1时,整个文件恰被分红一组,算法便终止。 希尔排序常规步骤: 一、选择增量gap=length/2 二、缩小增量继续以gap = gap/2的方式,n/2,(n/2)/2...1 ,有点晕了对吧,仍是看图解吧哈哈~
一样是二图(捂脸)
public class ShellSort { public static void main(String[] args) { int[] arr = new int[] { 3, 5, 2, 7, 8, 1, 2, 0, 4, 7, 4, 3, 8 }; System.out.println(Arrays.toString(arr)); shellSort(arr); System.out.println(Arrays.toString(arr)); } public static void shellSort(int[] arr) { int k = 1; // 遍历全部的步长 for (int d = arr.length / 2; d > 0; d /= 2) { // 遍历全部有元素 for (int i = d; i < arr.length; i++) { // 遍历本组中全部的元素 for (int j = i - d; j >= 0; j -= d) { // 若是当前元素大于加上步长后的那个元素 if (arr[j] > arr[j + d]) { int temp = arr[j]; arr[j] = arr[j + d]; arr[j + d] = temp; } } } System.out.println("第" + k + "次排序结果:" + Arrays.toString(arr)); k++; } } }
希尔排序算法是一种原地、不稳定的排序算法,最好时间复杂度状况:T(n) = O(nlog2 n) 最差时间复杂度状况:T(n) = O(nlog2 n) 平均时间复杂度状况:T(n) =O(nlog2n)
咱们习惯性把它简称为“快排”。快排利用的也是分治思想。乍看起来,它有点像归并排序,可是思路其实彻底不同。经过一趟排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另外一部分的关键字小,则可分别对这两部分记录继续进行排序,以达到整个序列有序。 快速排序常规步骤: 一、从数列中挑出一个元素,称为 “<font color=red>基准</font>”(pivot),通常第一个基数取第一个数; 二、从新排序数列,全部元素比基准值小的摆放在基准前面,全部元素比基准值大的摆在基准的后面(相同的数能够到任一边)。在这个分区退出以后,该基准就处于数列的中间位置。这个称为分区(partition)操做; 三、<font color=red>递归</font>地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。
貌似上图太过于抽象,仍是看下图吧,哈哈~
public class QuickSort { public static void main(String[] args) { int[] arr = new int[] {3,4,6,7,2,7,2,8,0,9,1}; quickSort(arr,0,arr.length-1); System.out.println(Arrays.toString(arr)); } public static void quickSort(int[] arr,int start,int end) { if(start<end) { //把数组中的第0个数字作为标准数 int stard=arr[start]; //记录须要排序的下标 int low=start; int high=end; //循环找比标准数大的数和比标准数小的数 while(low<high) { //右边的数字比标准数大 while(low<high&&stard<=arr[high]) { high--; } //使用右边的数字替换左边的数 arr[low]=arr[high]; //若是左边的数字比标准数小 while(low<high&&arr[low]<=stard) { low++; } arr[high]=arr[low]; } //把标准数赋给低所在的位置的元素 arr[low]=stard; //处理全部的小的数字 quickSort(arr, start, low); //处理全部的大的数字 quickSort(arr, low+1, end); } } }
快速排序算法是一种原地、不稳定的排序算法,最好时间复杂度状况:T(n) = O(nlogn) 最差时间复杂度状况:T(n) = O(n2) 平均时间复杂度状况:T(n) = O(nlogn)
归并排序(MERGE-SORT)是创建在归并操做上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个很是典型的应用。将已有序的子序列合并,获得彻底有序的序列;即先使每一个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。
归并操做的工做原理以下: 第一步:申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列 第二步:设定两个指针,最初位置分别为两个已经排序序列的起始位置 第三步:比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置 重复步骤3直到某一指针超出序列尾 将另外一序列剩下的全部元素直接复制到合并序列尾
public class MergeSort { public static void main(String[] args) { int[] arr = new int[] {1,3,5,2,4,6,8,10}; System.out.println(Arrays.toString(arr)); mergeSort(arr, 0, arr.length-1); System.out.println(Arrays.toString(arr)); } //归并排序 public static void mergeSort(int[] arr,int low,int high) { int middle=(high+low)/2; if(low<high) { //处理左边 mergeSort(arr, low, middle); //处理右边 mergeSort(arr, middle+1, high); //归并 merge(arr,low,middle,high); } } public static void merge(int[] arr,int low,int middle, int high) { //用于存储归并后的临时数组 int[] temp = new int[high-low+1]; //记录第一个数组中须要遍历的下标 int i=low; //记录第二个数组中须要遍历的下标 int j=middle+1; //用于记录在临时数组中存放的下标 int index=0; //遍历两个数组取出小的数字,放入临时数组中 while(i<=middle&&j<=high) { //第一个数组的数据更小 if(arr[i]<=arr[j]) { //把小的数据放入临时数组中 temp[index]=arr[i]; //让下标向后移一位; i++; }else { temp[index]=arr[j]; j++; } index++; } //处理多余的数据 while(j<=high) { temp[index]=arr[j]; j++; index++; } while(i<=middle) { temp[index]=arr[i]; i++; index++; } //把临时数组中的数据从新存入原数组 for(int k=0;k<temp.length;k++) { arr[k+low]=temp[k]; } } }
并归排序算法是一种稳定的排序算法,最好时间复杂度状况:T(n) = O(n) 最差时间复杂度状况:T(n) = O(nlogn) 平均时间复杂度状况:T(n) = O(nlogn)
基数排序也是非比较的排序算法,对每一位进行排序,从最低位开始排序,复杂度为O(kn),为数组长度,k为数组中的数的最大的位数;基数排序是按照低位先排序,而后收集;再按照高位排序,而后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序。最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。
<font color=red>小提示:注意进度条挡住的0~9的数字归类</font>
public class RadixSort { public static void main(String[] args) { int[] arr = new int[] {23,6,189,45,9,287,56,1,798,34,65,652,5}; radixSort(arr); System.out.println(Arrays.toString(arr)); } public static void radixSort(int[] arr) { //存最数组中最大的数字 int max=Integer.MIN_VALUE; for(int i=0;i<arr.length;i++) { if(arr[i]>max) { max=arr[i]; } } //计算最大数字是几位数 int maxLength = (max+"").length(); //用于临时存储数据的数组 int[][] temp = new int[10][arr.length]; //用于记录在temp中相应的数组中存放的数字的数量 int[] counts = new int[10]; //根据最大长度的数决定比较的次数 for(int i=0,n=1;i<maxLength;i++,n*=10) { //把每个数字分别计算余数 for(int j=0;j<arr.length;j++) { //计算余数 int ys = arr[j]/n%10; //把当前遍历的数据放入指定的数组中 temp[ys][counts[ys]] = arr[j]; //记录数量 counts[ys]++; } //记录取的元素须要放的位置 int index=0; //把数字取出来 for(int k=0;k<counts.length;k++) { //记录数量的数组中当前余数记录的数量不为0 if(counts[k]!=0) { //循环取出元素 for(int l=0;l<counts[k];l++) { //取出元素 arr[index] = temp[k][l]; //记录下一个位置 index++; } //把数量置为0 counts[k]=0; } } } } }
基数排序算法是一种稳定的排序算法,最好时间复杂度状况:T(n) = O(n * k) 最差时间复杂度状况:T(n) = O(n * k) 平均时间复杂度状况:T(n) = O(n * k)。
堆排序(英语:Heapsort)是指利用堆这种数据结构所设计的一种排序算法。堆是一个近似彻底二叉树的结构,并同时知足堆积的性质:即子结点的键值或索引老是小于(或者大于)它的父节点。
在堆的数据结构中,堆中的最大值老是位于根节点(在优先队列中使用堆的话堆中的最小值位于根节点)。堆中定义如下几种操做: 最大堆调整(Max Heapify):将堆的末端子节点做调整,使得子节点永远小于父节点 建立最大堆(Build Max Heap):将堆中的全部数据从新排序 堆排序(HeapSort):移除位在第一个数据的根节点,并作最大堆调整的递归运算
public class HeapSort { public static void main(String[] args) { int[] arr = new int[] {9,6,8,7,0,1,10,4,2}; heapSort(arr); System.out.println(Arrays.toString(arr)); } public static void heapSort(int[] arr) { //开始位置是最后一个非叶子节点,即最后一个节点的父节点 int start = (arr.length-1)/2; //调整为大顶堆 for(int i=start;i>=0;i--) { maxHeap(arr, arr.length, i); } //先把数组中的第0个和堆中的最后一个数交换位置,再把前面的处理为大顶堆 for(int i=arr.length-1;i>0;i--) { int temp = arr[0]; arr[0]=arr[i]; arr[i]=temp; maxHeap(arr, i, 0); } } public static void maxHeap(int[] arr,int size,int index) { //左子节点 int leftNode = 2*index+1; //右子节点 int rightNode = 2*index+2; int max = index; //和两个子节点分别对比,找出最大的节点 if(leftNode<size&&arr[leftNode]>arr[max]) { max=leftNode; } if(rightNode<size&&arr[rightNode]>arr[max]) { max=rightNode; } //交换位置 if(max!=index) { int temp=arr[index]; arr[index]=arr[max]; arr[max]=temp; //交换位置之后,可能会破坏以前排好的堆,因此,以前的排好的堆须要从新调整 maxHeap(arr, size, max); } } }
基数排序算法是一种原地、不稳定的排序算法,最好时间复杂度状况:T(n) = O(nlogn) 最差时间复杂度状况:T(n) = O(nlogn) 平均时间复杂度状况::T(n) = O(nlogn)
基本的知识都讲完了,不知道各位有木有想过这样一个问题:冒泡排序和插入排序的时间复杂度都是O(n2),都是原地排序算法,为何插入排序要比冒泡排序更受欢迎呢?
咱们前面分析冒泡排序和插入排序的时候讲到,冒泡排序无论怎么优化,元素交换的次数是一个固定值,是原始数据的逆序度。插入排序是一样的,无论怎么优化,元素移动的次数也等于原始数据的逆序度。
可是,从代码实现上来看,冒泡排序的数据交换要比插入排序的数据移动要复杂,冒泡排序须要3个赋值操做,而插入排序只须要1个。咱们来看这段操做:
冒泡排序中数据的交换操做: if (a[j] > a[j+1]) { // 交换 int tmp = a[j]; a[j] = a[j+1]; a[j+1] = tmp; flag = true; } 插入排序中数据的移动操做: if (a[j] > value) { a[j+1] = a[j]; // 数据移动 } else { break; }
咱们把执行一个赋值语句的时间粗略地计为单位时间(unit_time),而后分别用冒泡排序和插入排序对同一个逆序度是K的数组进行排序。用冒泡排序,须要K次交换操做,每次须要3个赋值语句,因此交换操做总耗时就是3*K单位时间。而插入排序中数据移动操做只须要K个单位时间。
这个只是咱们很是理论的分析,为了实验,针对上面的冒泡排序和插入排序的Java代码,我写了一个性能对比测试程序,随机生成10000个数组,每一个数组中包含200个数据,而后在个人机器上分别用冒泡和插入排序算法来排序,冒泡排序算法大约700ms才能执行完成,而插入排序只须要100ms左右就能搞定!
因此,虽然冒泡排序和插入排序在时间复杂度上是同样的,都是O(n2),可是若是咱们但愿把性能优化作到极致,那确定首选插入排序。插入排序的算法思路也有很大的优化空间,咱们只是讲了最基础的一种。若是你对插入排序的优化感兴趣,能够自行再温习一下希尔排序。
下面是八大经典算法的分析图:
到这里,以上八大经典算法分析,都是基于数组实现的。若是数据存储在链表中,这些排序算法还能工做吗?若是能,那相应的时间、空间复杂度又是多少呢?期待大牛评论出来~
若是本文章对你有帮助,哪怕是一点点,请点个赞呗,谢谢~
欢迎各位关注个人公众号,一块儿探讨技术,向往技术,追求技术...说好了来了就是盆友喔...