张子阳的博客

首页 读书 技术 店铺 关于
张子阳的博客 首页 读书 技术 关于

四种简单的排序算法

2008-10-02 张子阳 分类: 数据结构和算法

我觉得如果想成为一名优秀的开发者,不仅要积极学习时下流行的新技术,比如WCF、Asp.Net MVC、AJAX等,熟练应用一些已经比较成熟的技术,比如Asp.Net、WinForm。还应该有着牢固的计算机基础知识,比如数据结构、操作系统、编译原理、网络与数据通信等。有的朋友可能觉得这方面的东西过于艰深和理论化,望而却步,但我觉得假日里花上一个下午的时间,研究一种算法或者一种数据结构,然后写写心得,难道不是一件乐事么?所以,我打算将一些常见的数据结构和算法总结一下,不一定要集中一段时间花费很大精力,只是在比较空闲的时间用一种很放松的心态去完成。我最不愿意的,就是将写博客或者是学习技术变为一项工作或者负担,应该将它们视为生活中的一种消遣。人们总是说坚持不易,实际上当你提到“坚持”两个字之时,说明你已经将这件事视为了一种痛苦,你的内心深处并不愿意做这件事,所以才需要坚持。你从不曾听人说“我坚持玩了十年的电子游戏”,或者“坚持看了十年动漫、电影”、“坚持和心爱的女友相处了十年”吧?我从来不曾坚持,因为我将其视为一个爱好和消遣,就像许多人玩网络游戏一样。

好了,闲话就说这么多吧,我们回到正题。因为这方面的著作很多,所以这里只给出简单的描述和实现,供我本人及感兴趣的朋友参考。我会尽量用C#和C++两种语言实现,对于一些不好用C#表达的结构,仅用C++实现。

本文将描述四种最简单的排序方法,插入排序、泡沫排序、选择排序、希尔排序,我在这里将其称为“简单排序”,是因为它们相对于快速排序、归并排序、堆排序、分配排序、基数排序从理解和算法上要简单一些。对于后面这几种排序,我将其称为“高级排序”。

简单排序

开始之前先声明一个约定,对于数组中保存的数据,统一称为记录,以避免和“元素”,“对象”等名称相混淆。对于一个记录,用于排序的码,称为关键码。很显然,关键码的选择与数组中记录的类型密切相关,如果记录为int值,则关键码就是本身;如果记录是自定义对象,它很可能包含了多个字段,那么选定这些字段之一为关键码。凡是有关排序和查找的算法,就会关系到两个记录比较大小,而如何决定两个对象的大小,应该由算法程序的客户端(客户对象)决定。对于.NET来说,我们可以创建一个实现了IComparer<T>的类(对于C++也是类似)。关于IComparer<T>的更多信息,可以参考这篇文章《基于业务对象的排序》。最后,为了使程序简单,对于数组为空的情况我并没有做处理。

1.插入排序

算法思想

插入排序使用了两层嵌套循环,逐个处理待排序的记录。每个记录与前面已经排好序的记录序列进行比较,并将其插入到合适的位置。假设数组长度为n,外层循环控制变量i由1至n-1依次递进,用于选择当前处理哪条记录;里层循环控制变量j,初始值为i,并由i至1递减,与上一记录进行对比,决定将该元素插入到哪一个位置。这里的关键思想是,当处理第i条记录时,前面i-1条记录已经是有序的了。需要注意的是,因为是将当前记录与相邻的上一记录相比较,所以循环控制变量的起始值为1(数组下标),如果为0的话,上一记录为-1,则数组越界。

现在我们考察一下第i条记录的处理情况:假设外层循环递进到第i条记录,设其关键码的值为X,那么此时有可能有两种情况:

  1. 如果上一记录比X大,那么就交换它们,直到上一记录的关键码比X小或者相等为止。
  2. 如果上一记录比X小或者相等,那么之前的所有记录一定是有序的,且都比X小,此时退出里层循环。外层循环向前递进,处理下一条记录。

算法实现(C#)

public class SortAlgorithm { // 插入排序 public static void InsertSort<T, C>(T[] array, C comparer) where C:IComparer<T> { for (int i = 1; i <= array.Length - 1; i++) { //Console.Write("{0}: ", i); int j = i; while (j>=1 && comparer.Compare(array[j], array[j - 1]) < 0) { swap(ref array[j], ref array[j-1]); j--; } //Console.WriteLine(); //AlgorithmHelper.PrintArray(array); } } // 交换数组array中第i个元素和第j个元素 private static void swap<T>(ref T x,ref T y) { // Console.Write("{0}<-->{1} ", x, y); T temp = x; x = y; y = temp; } }

上面Console.WriteLine()方法和AlgorithmHelper.PrintArray()方法仅仅是出于测试方便,PrintArray()方法依次打印了数组的内容。swap<T>()方法则用于交换数组中的两条记录,也对交换数进行了打印(这里我注释掉了,但在测试时可以取消对它们的注释)。外层for循环控制变量i表示当前处理第i条记录。

public class AlgorithmHelper { // 打印数组内容 public static void PrintArray<T>(T[] array) { Console.Write(" Array:"); foreach (T item in array) { Console.Write(" {0}", item); } Console.WriteLine(); } } // 获得Comparer,进行比较 public class ComparerFactory { public static IComparer<int> GetIntComparer() { return new IntComparer(); } public class IntComparer : IComparer<int> { public int Compare(int x, int y) { return x.CompareTo(y); } } }

上面这段代码我们创建了一个ComparerFactory类,它用于获得一个IntComparer对象,这个对象实现了IComparer<T>接口,规定了两个int类型的关键码之间比较大小的规则。如果你有自定义的类型,比如叫MyType,只需要在ComparerFactory中再添加一个类,比如叫MyTypeComparer,然后让这个类也实现IComparer<T>接口,最后再添加一个方法返回MyTypeComparer就可以了。

输出演示(C#)

接下来我们看一下客户端代码和输出:

static void Main(string[] args) { int[] array = {42,20,17,13,28,14,23,15}; //int[] array = { 9, 8, 7, 6, 5, 4, 3, 2, 1, 0 }; AlgorithmHelper.PrintArray(array); SortAlgorithm.InsertSort (array, ComparerFactory.GetIntComparer()); }

算法实现(C++)

// 对int类型进行排序 class IntComparer{ public: static bool Smaller(int x, int y){ return x<y; } static bool Equal(int x, int y){ return x==y; } static bool Larger(int x, int y){ return x>y; } }; // 插入排序 template <class T, class C> void InsertSort(T a[], int length){ for(int i=1;i<=length-1;i++){ int j = i; while(j>=1 && C::Smaller(a[j], a[j-1])){ swap(a[j], a[j-1]); j--; } } }

冒泡排序

算法思想

如果你从没有学习过有关算法方面的知识,而需要设计一个数组排序的算法,那么很有可能设计出的就是泡沫排序算法了。因为它很好理解,实现起来也很简单。它也含有两层循环,假设数组长度为n,外层循环控制变量i由0到n-2递增,这个外层循环并不是处理某个记录,只是控制比较的趟数,由0到n-2,一共比较n-1趟。为什么n个记录只需要比较n-1趟?我们可以先看下最简单的两个数排序:比如4和3,我们只要比较一趟,就可以得出3、4。对于更多的记录可以类推。

数组记录的交换由里层循环来完成,控制变量j初始值为n-1(数组下标),一直递减到1。数组记录从数组的末尾开始与相邻的上一个记录相比,如果上一记录比当前记录的关键码大,则进行交换,直到当前记录的下标为1为止(此时上一记录的下标为0)。整个过程就好像一个气泡从底部向上升,于是这个排序算法也就被命名为了冒泡排序。

我们来对它进行一个考察,按照这种排序方式,在进行完第一趟循环之后,最小的一定位于数组最顶部(下标为0);第二趟循环之后,次小的记录位于数组第二(下标为1)的位置;依次类推,第n-1趟循环之后,第n-1小的记录位于数组第n-1(下标为n-2)的位置。此时无需再进行第n趟循环,因为最后一个已经位于数组末尾(下标为n-1)位置了。

算法实现(C#)

// 泡沫排序 public static void BubbleSort<T, C>(T[] array, C comparer) where C : IComparer<T> { int length = array.Length; for (int i = 0; i <= length - 2; i++) { //Console.Write("{0}: ", i + 1); for (int j = length - 1; j >= 1; j--) { if (comparer.Compare(array[j], array[j - 1]) < 0) { swap(ref array[j], ref array[j - 1]); } } //Console.WriteLine(); //AlgorithmHelper.PrintArray(array); } }

输出演示(C#)

static void Main(string[] args) { int[] array = {42,20,17,13,28,14,23,15}; AlgorithmHelper.PrintArray(array); SortAlgorithm.BubbleSort (array, ComparerFactory.GetIntComparer()); }

算法实现(C++)

// 冒泡排序 template <class T, class C> void BubbleSort(T a[], int length){ for(int i=0;i<=length-2;i++){ for(int j=length-1; j>=1; j--){ if(C::Smaller(a[j], a[j-1])) swap(a[j], a[j-1]); } } }

3.选择排序

算法思想

选择排序是对冒泡排序的一个改进,从上面冒泡排序的输出可以看出,在第一趟时,为了将最小的值13由数组末尾冒泡的数组下标为0的第一个位置,进行了多次交换。对于后续的每一趟,都会进行类似的交换。

选择排序的思路是:对于第一趟,搜索整个数组,寻找出最小的,然后放置在数组的0号位置;对于第二趟,搜索数组的n-1个记录,寻找出最小的(对于整个数组来说则是次小的),然后放置到数组的第1号位置。在第i趟时,搜索数组的n-i+1个记录,寻找最小的记录(对于整个数组来说则是第i小的),然后放在数组i-1的位置(注意数组以0起始)。可以看出,选择排序显著的减少了交换的次数。

需要注意的地方是:在第i趟时,内层循环并不需要递减到1的位置,只要循环到与i相同就可以了,因为之前的位置一定都比它小(也就是第i小)。另外里层循环是j>i,而不是j>=i,这是因为i在进入循环之后就被立即保存到了lowestIndex中。

算法实现(C#)

public static void SelectionSort<T, C>(T[] array, C comparer) where C : IComparer<T> { int length = array.Length; for (int i = 0; i <= length - 2; i++) { Console.Write("{0}: ", i+1); int lowestIndex = i; // 最小记录的数组索引 for (int j = length - 1; j > i; j--) { if (comparer.Compare(array[j], array[lowestIndex]) < 0) lowestIndex = j; } swap(ref array[i], ref array[lowestIndex]); AlgorithmHelper.PrintArray(array); } }

输出演示(C#)

static void Main(string[] args) { int[] array = {42,20,17,13,28,14,23,15}; AlgorithmHelper.PrintArray(array); SortAlgorithm.SelectionSort (array, ComparerFactory.GetIntComparer()); }

算法实现(C++)

// 选择排序 template <class T, class C> void SelectionSort(T a[], int length) { for(int i = 0; i <= length-2; i++){ int lowestIndex = i; for(int j = length-1; j>i; j--){ if(C::Smaller(a[j], a[lowestIndex])) lowestIndex = j; } swap(a[i], a[lowestIndex]); } }

4.希尔排序

希尔排序利用了插入排序的一个特点来优化排序算法,插入排序的这个特点就是:当数组基本有序的时候,插入排序的效率比较高。比如对于下面这样一个数组:

int[] array = { 1, 0, 2, 3, 5, 4, 8, 6, 7, 9 };

插入排序的输出如下:

可以看到,尽管比较的趟数没有减少,但是交换的次数却明显很少。希尔排序的总体想法就是先让数组基本有序,最后再应用插入排序。具体过程如下:假设有数组int a[] = {42,20,17,13,28,14,23,15},不失一般性,我们设其长度为length。

第一趟时,步长step = length/2 = 4,将数组分为4组,每组2个记录,则下标分别为(0,4)(1,5)(2,6)(3,7);转换为数值,则为{42,28}, {20,14}, {17,23}, {13,15}。然后对每个分组进行插入排序,之后分组数值为{28,42}, {14,20}, {17,23}, {13,15},而实际的原数组的值就变成了{28,14,17,13,42,20,23,15}。这里要注意的是分组中记录在原数组中的位置,以第2个分组{14,20}来说,它的下标是(1,5),所以这两个记录在原数组的下标分别为a[1]=14;a[5]=20。

第二趟时,步长 step = step/2 = 2,将数组分为2组,每组4个记录,则下标分别为(0,2,4,6)(1,3,5,7);转换为数值,则为{28,17,42,23}, {14,13,20,15},然后对每个分组进行插入排序,得到{17,23,28,42}{13,14,15,20}。此时数组就成了{17,13,23,14,28,15,42,20},已经基本有序。

第三趟时,步长 step=step/2 = 1,此时相当进行一次完整的插入排序,得到最终结果{13,14,15,17,20,23,28,42}。

算法实现(C#)

// 希尔排序 public static void ShellSort<T, C>(T[] array, C comparer) where C : IComparer<T> { for (int i = array.Length / 2; i >= 1; i = i / 2) { Console.Write("{0}: ", i); for (int j = 0; j < i; j++) { InsertSort(array, j, i, comparer); } Console.WriteLine(); AlgorithmHelper.PrintArray(array); } } // 用于希尔排序的插入排序 private static void InsertSort<T, C> (T[] array, int startIndex, int step, C comparer) where C : IComparer<T> { for (int i = startIndex + step; i <= array.Length - 1; i += step) { int j = i; while(j>= step && comparer.Compare(array[j], array[j - step]) <0 ){ swap(ref array[j], ref array[j - step]); j -= step; } } }

注意这里插入排序InsertSort()方法的参数,startIndex是分组的起始索引,step是步长,可以看出,前面的插入排序只是此处step=1,startindex=0的一个特例

输出演示(C#)

static void Main(string[] args) { int[] array = {42,20,17,13,28,14,23,15}; AlgorithmHelper.PrintArray(array); SortAlgorithm.ShellSort (array, ComparerFactory.GetIntComparer()); }

算法实现(C++)

// 希尔排序 template<class T, class C> void ShellSort(T a[], int length){ for(int i = length/2; i >= 1; i = i/2 ){ for(int j = 0; j<i; j++){ InsertSort<T, C>(&a[j], length-1, i); } } } // 用于希尔排序的插入排序 template<class T, class C> void InsertSort(T a[], int length, int step){ for(int i = step; i<length; i+= step){ int j = i; while(j>=step && C::Smaller(a[j], a[j-step])){ swap(a[j], a[j-step]); j-=step; } } }

对于上面三种算法的代价,插入排序、冒泡排序、选择排序,都是Θ(n2),而希尔排序略好一些,是Θ(n1.5),关于算法分析,大家感兴趣可以参考相关书籍。这里推荐《数据结构与算法分析(C++版)第二版》和《算法I~IV(C++实现)——基础、数据结构、排序和搜索》,都很不错,我主要也是参考这两本书。

感谢阅读,希望这篇文章能给你带来帮助!