SkyWT

10/10/2018

(转)八大排序算法稳定性分析

This blog post is only available in Simplified Chinse.

转自知乎:八大排序算法稳定性分析,原来稳定性是这个意思…… 这是 €€F 非常喜欢的排序稳定性分析……

稳定性定义: 排序前后两个相等的数相对位置不变,则算法稳定。 稳定性的好处: 从一个键上排序,然后再从另一个键上排序,第一个键排序的结果可以为第二个键排序所用。

各排序算法的稳定性:

  1. 堆排序、快速排序、希尔排序、直接选择排序不是稳定的排序算法;
  2. 基数排序、冒泡排序、直接插入排序、折半插入排序、归并排序是稳定的排序算法。

一、冒泡排序

  • 小的元素往前调或者把大的元素往后调;

  • 比较是相邻的两个元素比较,交换也发生在这两个元素之间;

  • 稳定排序算法。

二、选择排序

  • 每个位置选择当前元素最小的;

  • 在一趟选择中,如果当前元素比一个元素小,而该小的元素又出现在一个和当前元素相等的元素后面,那么交换后稳定性就被破坏了;

  • 举个例子,序列5 8 5 2 9, 我们知道第一遍选择第1个元素5会和2交换,那么原序列中2个5的相对前后顺序就被破坏了;

  • 不稳定的排序算法。

三、插入排序

  • 已经有序的小序列的基础上,一次插入一个元素;

  • 想要插入的元素和已经有序的最大者开始比起,如果比它大则直接插入在其后面,否则一直往前找直到找到它该插入的位置;

  • 如果碰见一个和插入元素相 等的,那么插入元素把想插入的元素放在相等元素的后面;

  • 相等元素的前后顺序没有改变;

  • 稳定排序算法。

四、快速排序

  • 两个方向,左边的i下标一直往右走,当a[i] <= a[center_index],其中 center_index 是中枢元素的数组下标,一般取为数组第0个元素。而右边的j下标一直往左走,当a[j] > a[center_index];

  • 如果i和j都走不动了,i <= j, 交换a[i]和a[j],重复上面的过程,直到i>j;

  • 交换 a[j] 和 a[center_index],完成一趟快速排序;

  • 在中枢元素和 a[j] 交换的时候,很有可能把前面的元素的稳定性打乱,比如序列为 5 3 3 4 3 8 9 10 11, 现在中枢元素5和3(第5个元素,下标从1开始计)交换就会把元素3的稳定性打乱;

  • 不稳定发生在中枢元素和a[j] 交换的时刻;

  • 不稳定的排序算法。

五、归并排序

  • 把序列递归地分成短序列,递归出口是短序列只有1个元素(认为直接有序)或者2个序列(1次比较和交换),然后把各个有序的短序列合并成一个有序的长序列,不断合并直到原序列全部排好序;

  • 合并过程中我们可以保证如果两个当前元素相等时,我们把处在前面的序列的元素保存在结 果序列的前面,这样就保证了稳定性;

  • 稳定排序算法。

六、希尔排序(shell)

  • 按照不同步长对元素进行插入排序;

  • 当刚开始元素很无序的时候,步长最大,所以插入排序的元素个数很少,速度很快;

  • 当元素基本有序了,步长很小, 插入排序对于有序的序列效率很高;

  • 所以,希尔排序的时间复杂度会比o(n^2)好一些

  • 由于多次插入排序,我们知道一次插入排序是稳定的,不会改变相同元 素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱;

  • 不稳定的排序算法。

七、基数排序

  • 按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位;

  • 有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优 先级排序,最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前;

  • 用于整数;

  • 需要较多的存储空间;

  • 基于分别排序,分别收集;

  • 稳定排序算法。

八、堆排序

  • 是选择排序的一种;

  • 堆的结构是节点i的孩子为2i和2i+1节点,大顶堆要求父节点大于等于其2个子节点,小顶堆要求父节点小于等于其2个子节点,是完全二叉树;

  • 在一个长为n 的序列,堆排序的过程是从第n/2开始和其子节点共3个值选择最大(大顶堆)或者最小(小顶堆),这3个元素之间的选择当然不会破坏稳定性。但当为n /2-1, n/2-2, …1这些个父节点选择元素时,就会破坏稳定性。有可能第n/2个父节点交换把后面一个元素交换过去了,而第n/2-1个父节点把后面一个相同的元素没 有交换,那么这2个相同的元素之间的稳定性就被破坏了;

  • 不稳定的排序算法。

九、各排序算法的优劣对照表

|排序算法|最优时间复杂度 |平均时间复杂度 |最坏时间复杂度 |空间复杂度 |稳定性| |:-----:|:---------------:|:---------------:|:---------------:|:---------------:|:---:| |插入排序|Θ(n)\Theta(n) |Θ(n2)\Theta(n^2) |Θ(n2)\Theta(n^2) |Θ(1)\Theta(1) | 稳定 | |希尔排序|Θ(n)\Theta(n) |Θ(nlogn)\Theta(n\log n)|Θ(玄学)\Theta(玄学) |Θ(1)\Theta(1) |不稳定| |选择排序|Θ(n2)\Theta(n^2) |Θ(n2)\Theta(n^2) |Θ(n2)\Theta(n^2) |Θ(1)\Theta(1) |不稳定| |堆排序 |Θ(nlogn)\Theta(n\log n)|Θ(nlogn)\Theta(n\log n)|Θ(nlogn)\Theta(n\log n)|Θ(1)\Theta(1) |不稳定| |冒泡排序|Θ(n)\Theta(n) |Θ(n2)\Theta(n^2) |Θ(n2)\Theta(n^2) |Θ(1)\Theta(1) | 稳定 | |快速排序|Θ(nlogn)\Theta(n\log n)|Θ(nlogn)\Theta(n\log n)|Θ(n2)\Theta(n^2) |Θ(logn)\Theta(\log n) |不稳定| |快速排序|Θ(nlogn)\Theta(n\log n)|Θ(nlogn)\Theta(n\log n)|Θ(nlogn)\Theta(n\log n)|Θ(nlogn)\Theta(n\log n)| 稳定 | |基数排序|Θ(d(n+rd))\Theta(d(n+rd))|Θ(d(r+n))\Theta(d(r+n)) |Θ(d(r+n))\Theta(d(r+n)) |Θ(rd+n)\Theta(rd+n) | 稳定 |

(基数排序的复杂度中,r 代表关键词基数,d 代表长度,n 代表关键词个数) (原图:https://pic1.zhimg.com/80/v2-e3a121dea092f9ec2ef727ceab030aad_hd.jpg )

From: https://zhuanlan.zhihu.com/p/36120420

Post a New Comment

Please login to leave a comment.