python 十大经典排序算法

时间 2020-06-02

原文原文链接

python 十大经典排序算法排序算法能够分为内部排序和外部排序，内部排序是数据记录在内存中进行排序，而外部排序是因排序的数据很大，一次不能容纳所有的排序记录，在排序过程当中须要访问外存。常见的内部排序算法有：插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。用一张图归纳：python

关于时间复杂度：算法

平方阶 (O(n2)) 排序各种简单排序：直接插入、直接选择和冒泡排序。
线性对数阶 (O(nlog2n)) 排序快速排序、堆排序和归并排序。
O(n1+§)) 排序，§ 是介于 0 和 1 之间的常数。希尔排序。
线性阶 (O(n)) 排序基数排序，此外还有桶、箱排序。关于稳定性：稳定的排序算法：冒泡排序、插入排序、归并排序和基数排序。不是稳定的排序算法：选择排序、快速排序、希尔排序、堆排序。名词解释： n：数据规模 k：“桶”的个数 In-place：占用常数内存，不占用额外内存 Out-place：占用额外内存稳定性：排序后 2 个相等键值的顺序和排序以前它们的顺序相同

冒泡排序冒泡排序（Bubble Sort）也是一种简单直观的排序算法。它重复地走访过要排序的数列，一次比较两个元素，若是他们的顺序错误就把他们交换过来。走访数列的工做是重复地进行直到没有再须要交换，也就是说该数列已经排序完成。这个算法的名字由来是由于越小的元素会经由交换慢慢“浮”到数列的顶端。做为最简单的排序算法之一，冒泡排序给个人感受就像 Abandon 在单词书里出现的感受同样，每次都在第一页第一位，因此最熟悉。冒泡排序还有一种优化算法，就是立一个 flag，当在一趟序列遍历中元素没有发生交换，则证实该序列已经有序。但这种改进对于提高性能来讲并无什么太大做用。shell

算法步骤api
比较相邻的元素。若是第一个比第二个大，就交换他们两个。数组
对每一对相邻元素做一样的工做，从开始第一对到结尾的最后一对。这步作完后，最后的元素会是最大的数。数据结构
针对全部的元素重复以上的步骤，除了最后一个。架构
持续每次对愈来愈少的元素重复上面的步骤，直到没有任何一对数字须要比较。app
动图演示ide
Python 代码实现 def bubbleSort(arr): for i in range(1, len(arr)): for j in range(0, len(arr)-i): if arr[j] > arr[j+1]: arr[j], arr[j + 1] = arr[j + 1], arr[j] return arr 选择排序选择排序是一种简单直观的排序算法，不管什么数据进去都是 O(n²) 的时间复杂度。因此用到它的时候，数据规模越小越好。惟一的好处可能就是不占用额外的内存空间了吧。函数
算法步骤
首先在未排序序列中找到最小（大）元素，存放到排序序列的起始位置
再从剩余未排序元素中继续寻找最小（大）元素，而后放到已排序序列的末尾。
重复第二步，直到全部元素均排序完毕。
动图演示
Python 代码实现 def selectionSort(arr): for i in range(len(arr) - 1): # 记录最小数的索引 minIndex = i for j in range(i + 1, len(arr)): if arr[j] < arr[minIndex]: minIndex = j # i 不是最小数时，将 i 和最小数进行交换 if i != minIndex: arr[i], arr[minIndex] = arr[minIndex], arr[i] return arr

插入排序

插入排序的代码实现虽然没有冒泡排序和选择排序那么简单粗暴，但它的原理应该是最容易理解的了，由于只要打过扑克牌的人都应该可以秒懂。插入排序是一种最简单直观的排序算法，它的工做原理是经过构建有序序列，对于未排序数据，在已排序序列中从后向前扫描，找到相应位置并插入。插入排序和冒泡排序同样，也有一种优化算法，叫作拆半插入。

算法步骤
将第一待排序序列第一个元素看作一个有序序列，把第二个元素到最后一个元素当成是未排序序列。
从头至尾依次扫描未排序序列，将扫描到的每一个元素插入有序序列的适当位置。（若是待插入的元素与有序序列中的某个元素相等，则将待插入元素插入到相等元素的后面。）
动图演示
Python 代码实现 def insertionSort(arr): for i in range(len(arr)): preIndex = i-1 current = arr[i] while preIndex >= 0 and arr[preIndex] > current: arr[preIndex+1] = arr[preIndex] preIndex-=1 arr[preIndex+1] = current return arr

希尔排序

希尔排序，也称递减增量排序算法，是插入排序的一种更高效的改进版本。但希尔排序是非稳定排序算法。希尔排序是基于插入排序的如下两点性质而提出改进方法的： • 插入排序在对几乎已经排好序的数据操做时，效率高，便可以达到线性排序的效率； • 但插入排序通常来讲是低效的，由于插入排序每次只能将数据移动一位；希尔排序的基本思想是：先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序，待整个序列中的记录“基本有序”时，再对全体记录进行依次直接插入排序。

算法步骤
选择一个增量序列 t1，t2，……，tk，其中 ti > tj, tk = 1；
按增量序列个数 k，对序列进行 k 趟排序；
每趟排序，根据对应的增量 ti，将待排序列分割成若干长度为 m 的子序列，分别对各子表进行直接插入排序。仅增量因子为 1 时，整个序列做为一个表来处理，表长度即为整个序列的长度。
Python 代码实现 def shellSort(arr): import math gap=1 while(gap < len(arr)/3): gap = gap*3+1 while gap > 0: for i in range(gap,len(arr)): temp = arr[i] j = i-gap while j >=0 and arr[j] > temp: arr[j+gap]=arr[j] j-=gap arr[j+gap] = temp gap = math.floor(gap/3) return arr

归并排序

归并排序（Merge sort）是创建在归并操做上的一种有效的排序算法。该算法是采用分治法（Divide and Conquer）的一个很是典型的应用。做为一种典型的分而治之思想的算法应用，归并排序的实现由两种方法： • 自上而下的递归（全部递归的方法均可以用迭代重写，因此就有了第 2 种方法）； • 自下而上的迭代；在《数据结构与算法 JavaScript 描述》中，做者给出了自下而上的迭代方法。可是对于递归法，做者却认为： However, it is not possible to do so in JavaScript, as the recursion goes too deep for the language to handle. 然而，在 JavaScript 中这种方式不太可行，由于这个算法的递归深度对它来说太深了。说实话，我不太理解这句话。意思是 JavaScript 编译器内存过小，递归太深容易形成内存溢出吗？还望有大神可以指教。和选择排序同样，归并排序的性能不受输入数据的影响，但表现比选择排序好的多，由于始终都是 O(nlogn) 的时间复杂度。代价是须要额外的内存空间。

算法步骤
申请空间，使其大小为两个已经排序序列之和，该空间用来存放合并后的序列；
设定两个指针，最初位置分别为两个已经排序序列的起始位置；
比较两个指针所指向的元素，选择相对小的元素放入到合并空间，并移动指针到下一位置；
重复步骤 3 直到某一指针达到序列尾；
将另外一序列剩下的全部元素直接复制到合并序列尾。
动图演示
Python 代码实现 def mergeSort(arr): import math if(len(arr)<2): return arr middle = math.floor(len(arr)/2) left, right = arr[0:middle], arr[middle:] return merge(mergeSort(left), mergeSort(right))

def merge(left,right): result = [] while left and right: if left[0] <= right[0]: result.append(left.pop(0)); else: result.append(right.pop(0)); while left: result.append(left.pop(0)); while right: result.append(right.pop(0)); return result

快速排序

快速排序是由东尼·霍尔所发展的一种排序算法。在平均情况下，排序 n 个项目要 Ο(nlogn) 次比较。在最坏情况下则须要 Ο(n2) 次比较，但这种情况并不常见。事实上，快速排序一般明显比其余 Ο(nlogn) 算法更快，由于它的内部循环（inner loop）能够在大部分的架构上颇有效率地被实现出来。快速排序使用分治法（Divide and conquer）策略来把一个串行（list）分为两个子串行（sub-lists）。快速排序又是一种分而治之思想在排序算法上的典型应用。本质上来看，快速排序应该算是在冒泡排序基础上的递归分治法。快速排序的名字起的是简单粗暴，由于一听到这个名字你就知道它存在的意义，就是快，并且效率高！它是处理大数据最快的排序算法之一了。虽然 Worst Case 的时间复杂度达到了 O(n²)，可是人家就是优秀，在大多数状况下都比平均时间复杂度为 O(n logn) 的排序算法表现要更好，但是这是为何呢，我也不知道。好在个人强迫症又犯了，查了 N 多资料终于在《算法艺术与信息学竞赛》上找到了满意的答案：快速排序的最坏运行状况是 O(n²)，好比说顺序数列的快排。但它的平摊指望时间是 O(nlogn)，且 O(nlogn) 记号中隐含的常数因子很小，比复杂度稳定等于 O(nlogn) 的归并排序要小不少。因此，对绝大多数顺序性较弱的随机数列而言，快速排序老是优于归并排序。

算法步骤
从数列中挑出一个元素，称为 “基准”（pivot）;
从新排序数列，全部元素比基准值小的摆放在基准前面，全部元素比基准值大的摆在基准的后面（相同的数能够到任一边）。在这个分区退出以后，该基准就处于数列的中间位置。这个称为分区（partition）操做；
递归地（recursive）把小于基准值元素的子数列和大于基准值元素的子数列排序；递归的最底部情形，是数列的大小是零或一，也就是永远都已经被排序好了。虽然一直递归下去，可是这个算法总会退出，由于在每次的迭代（iteration）中，它至少会把一个元素摆到它最后的位置去。
动图演示
Python 代码实现 def quickSort(arr, left=None, right=None): left = 0 if not isinstance(left,(int, float)) else left right = len(arr)-1 if not isinstance(right,(int, float)) else right if left < right: partitionIndex = partition(arr, left, right) quickSort(arr, left, partitionIndex-1) quickSort(arr, partitionIndex+1, right) return arr

def partition(arr, left, right): pivot = left index = pivot+1 i = index while i <= right: if arr[i] < arr[pivot]: swap(arr, i, index) index+=1 i+=1 swap(arr,pivot,index-1) return index-1

def swap(arr, i, j): arr[i], arr[j] = arr[j], arr[i]

堆排序

堆排序（Heapsort）是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似彻底二叉树的结构，并同时知足堆积的性质：即子结点的键值或索引老是小于（或者大于）它的父节点。堆排序能够说是一种利用堆的概念来排序的选择排序。分为两种方法： 21. 大顶堆：每一个节点的值都大于或等于其子节点的值，在堆排序算法中用于升序排列； 22. 小顶堆：每一个节点的值都小于或等于其子节点的值，在堆排序算法中用于降序排列；堆排序的平均时间复杂度为 Ο(nlogn)。

算法步骤
建立一个堆 H[0……n-1]；
把堆首（最大值）和堆尾互换；
把堆的尺寸缩小 1，并调用 shift_down(0)，目的是把新的数组顶端数据调整到相应位置；
重复步骤 2，直到堆的尺寸为 1。
动图演示
Python 代码实现 def buildMaxHeap(arr): import math for i in range(math.floor(len(arr)/2),-1,-1): heapify(arr,i)

def heapify(arr, i): left = 2i+1 right = 2i+2 largest = i if left < arrLen and arr[left] > arr[largest]: largest = left if right < arrLen and arr[right] > arr[largest]: largest = right

if largest != i:
    swap(arr, i, largest)
    heapify(arr, largest)

def swap(arr, i, j): arr[i], arr[j] = arr[j], arr[i]

def heapSort(arr): global arrLen arrLen = len(arr) buildMaxHeap(arr) for i in range(len(arr)-1,0,-1): swap(arr,0,i) arrLen -=1 heapify(arr, 0) return arr

计数排序

计数排序的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。做为一种线性时间复杂度的排序，计数排序要求输入的数据必须是有肯定范围的整数。

动图演示
Python 代码实现 def countingSort(arr, maxValue): bucketLen = maxValue+1 bucket = [0]*bucketLen sortedIndex =0 arrLen = len(arr) for i in range(arrLen): if not bucket[arr[i]]: bucket[arr[i]]=0 bucket[arr[i]]+=1 for j in range(bucketLen): while bucket[j]>0: arr[sortedIndex] = j sortedIndex+=1 bucket[j]-=1 return arr

桶排序桶排序是计数排序的升级版。它利用了函数的映射关系，高效与否的关键就在于这个映射函数的肯定。为了使桶排序更加高效，咱们须要作到这两点： 27. 在额外空间充足的状况下，尽可能增大桶的数量 28. 使用的映射函数可以将输入的 N 个数据均匀的分配到 K 个桶中同时，对于桶中元素的排序，选择何种比较排序算法对于性能的影响相当重要。

何时最快当输入的数据能够均匀的分配到每个桶中。
何时最慢当输入的数据被分配到了同一个桶中。

基数排序基数排序是一种非比较型整数排序算法，其原理是将整数按位数切割成不一样的数字，而后按每一个位数分别比较。因为整数也能够表达字符串（好比名字或日期）和特定格式的浮点数，因此基数排序也不是只能使用于整数。

基数排序 vs 计数排序 vs 桶排序

基数排序有两种方法：这三种排序算法都利用了桶的概念，但对桶的使用方法上有明显差别： • 基数排序：根据键值的每位数字来分配桶； • 计数排序：每一个桶只存储单一键值； • 桶排序：每一个桶存储必定范围的数值；

LSD 基数排序动图演示