归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。
归并过程分解
假设两个有序表分别为a,b,最后归并到r表中。
归并过程:比较a[i]和a[j]的大小,若a[i]≤a[j],则将第一个有序表中的元素a[i]复制到r[k]中,并令i和k分别加上1;否则将第二个有序表中的元素a[j]复制到r[k]中,并令j和k分别加上1,如此循环下去,直到其中一个有序表取完,然后再将另一个有序表中剩余的元素复制到r中从下标k到下标t的单元。归并排序的算法我们通常用递归实现,先把待排序区间[s,t]以中点二分,接着把左边子区间排序,再把右边子区间排序,最后把左区间和右区间用一次归并操作合并成有序的区间[s,t]。
示例分解
假设原始序列为:{6,202,100,301,38,8,1},其长度len = 7,归并过程:
1、第一次归并:先中分得到mid索引为3,递归归并左半部分{6, 202, 100,
301},对这个子序列又中分为{6, 202}和{100,
301},此时这两个子序列已有序;递归归并右半部分{38, 8,
1},对这个子序列又中分为{38, 8}和{1},归并后形成{8,38}和{1},共比较3次
2、第二次归并:第一次归并后变成{6,202},{100,301},{8,38},{1},即{6,
202,100,301,8,38,1},再中分得到{6,202,100,301}和{8,38,1},分别递归归并后为{6,100,202,301}新序列和{1,8,31}新序列,共比较3+1=4次。
3、第三次归并:第二次归并后,得到的两个有序的子序列为{6,100,202,301}和{1,8,38},这一次是递归回到第一层了,已经是中分了,直接比较和复制到新的r即可。最终得到{1,6,8,38,100,202,301},共比较4次(6与1比较,6与8比较,100与8比较,100与38比较)。
这个序列从无序到有序总共比较了3+4+4=11次。
算法复杂度分析
归并排序的效率是比较高的,假设数列长度为N,采用中分法的方式将数列分开成若干个小数列一共要log2N
步,每步都是一个合并有序数列的过程,时间复杂度可以记为O ( N ),故一共为O
( N * log2N)。
因为归并排序每次都是在相邻的数据中进行操作,所以归并排序在常用的几种排序方法(快速排序,归并排序,希尔排序,堆排序)中也是效率比较高的。
时间复杂度:O ( N * log2N )
C语言实现
/**
- 归并排序算法
*
@param list 待排序的序列
@param first 子序列的起点索引
@param last 子序列的终点索引
@param temp 临时数组,用于将两个子序列二路归并时存储
*/
void mergeSort(int list[], int first, int last, int temp[]) {
if (first < last) {
int mid = (first + last) / 2;
// 递归归并中分左子序列,使子序列有序
mergeSort(list, first, mid, temp);
// 递归归并中分右子序列,使子序列有序
mergeSort(list, mid + 1, last, temp);
// 最后二路归并,使序列成有序
//
必须明白的一点,每次中分递归归并都需要二路归并,因为中分后的任意子序列
// 在有序后,都要二路归并成一个序列
mergeList(list, first, mid, last, temp);
}
}
/**
- 二路归并list[first…mid]子序列与list[mid+1…last]
*
@param list 序列
@param first 左子序列的起点
@param mid 序列中间分割点
@param last 右序列终点
@param temp 临时序列,用于将两个无序的子序列归并到temp中,使之有序
*/
void mergeList(int list[], int first, int mid, int last, int temp[])
{
int leftIndex = first;
int leftEndIndex = mid;
int rightIndex = mid + 1;
int rightEndIndex = last;
int tempIndex = 0;
//
寻找两个子序列,顺序遍历,将值小的复制到临时数组中,直到其中一个子序列遍历完毕
while (leftIndex <= leftEndIndex && rightIndex <= rightEndIndex) {
// 值小的就复制到临时数组中
if (list[leftIndex] <= list[rightIndex]) {
temp[tempIndex] = list[leftIndex];
tempIndex++;
leftIndex++;
} else {
temp[tempIndex] = list[rightIndex];
tempIndex++;
rightIndex++;
}
}
// 有可能左子序列更长,因此将剩下的部分直接复制到临时数组中
while (leftIndex <= leftEndIndex) {
temp[tempIndex++] = list[leftIndex++];
}
// 有可能右子序列更长,因此将剩下的部分直接复制到临时数组中
while (rightIndex <= rightEndIndex) {
temp[tempIndex++] = list[rightIndex++];
}
// 最后还需要将有序的临时数组复制到原始序列中
for (int i = 0; i < tempIndex; ++i) {
list[first + i] = temp[i];
}
// 这里添加一个打印,记录归并
NSMutableString *str = [[NSMutableString alloc] init];
for (int i = 0; i < sizeof(list) - 1; ++i) {
if (i == 0) {
[str appendFormat:@”%d”, list[i]];
} else {
[str appendFormat:@”, %d”, list[i]];
}
}
NSLog(@”此次二路归并后,得到的序列为:(%@)”, str);
}
测试:
int list[] = {6, 202, 100, 301, 38, 8, 1};
int temp[7] = {0};
mergeSort(list, 0, 7-1, temp);
打印效果:
此次二路归并后,得到的序列为:(6, 202, 100, 301, 38, 8, 1)
此次二路归并后,得到的序列为:(6, 202, 100, 301, 38, 8, 1)
此次二路归并后,得到的序列为:(6, 100, 202, 301, 38, 8, 1)
此次二路归并后,得到的序列为:(6, 100, 202, 301, 8, 38, 1)
此次二路归并后,得到的序列为:(6, 100, 202, 301, 1, 8, 38)
此次二路归并后,得到的序列为:(1, 6, 8, 38, 100, 202, 301)
从打印结果可以看出来,果然与我们前面的算法分析是一样的。