欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

数据结构和算法(十)冒泡排序

程序员文章站 2022-06-04 15:04:33
...

定义

冒泡排序是一种简单的排序算法。它重复地遍历要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。遍历数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。

算法步骤

  • 比较相邻的两个元素,如果第一个比第二个大,则交换它们两个。
  • 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。
  • 针对所有的元素重复以上的步骤,除了最后一个。
  • 持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。

动图分析

数据结构和算法(十)冒泡排序

过程分析

这六个数组成的无序序列[5,9,3,6,2,7],由小到大排序。
按照冒泡排序算法,相邻元素两两比较,过程如下:

  • 首先比较5和9,5比9小,所以元素位置不变:第一次交换结果为 [5, 9, 3, 6, 2, 7]
  • 继续比较9和3,9比3大,所以互换位置:第二次交换结果为 [5, 3, 9, 6, 2, 7]
    数据结构和算法(十)冒泡排序
  • 继续比较9和6,9比6大,所以互换位置:第三次交换结果为[5, 3, 6, 9, 2, 7]
    数据结构和算法(十)冒泡排序
  • 继续比较9和2,9比2大,所以互换位置,第四次交换结果为[5, 3, 6, 2, 9, 7]
    数据结构和算法(十)冒泡排序
  • 继续比较9和7,9比7大,所以互换位置,第五次交换结果为[5, 3, 6, 2, 7, 9]
    数据结构和算法(十)冒泡排序
    这样一来 最大元素9像气泡一样,飘到了最右面。
    这时候,我们的冒泡排序的第一轮结束了。数列最右侧的元素9可以认为是一个有序区域,有序区域目前只有一个元素。
    数据结构和算法(十)冒泡排序
    下面进行第二轮冒泡排序
  • 首先比较5和3,5比3大,所以互换位置,第二轮第一次交换结果为[3, 5, 6, 2, 7, 9]
    数据结构和算法(十)冒泡排序
  • 继续比较5和6,5比6小,所以元素位置不变,第二轮第二次交换结果为[3, 5, 6, 2, 7, 9]
  • 继续比较6和2,6比2大,所以互换位置,第二轮第三次交换结果为[3, 5, 2, 6, 7, 9]
    数据结构和算法(十)冒泡排序
  • 继续比较6和7,6比7小,所以元素位置不变,第二轮第四次交换结果为[3, 5, 2, 6, 7, 9]
    这样一来,经过两轮排序,右侧有序序列变成了两个元素。
    数据结构和算法(十)冒泡排序
    后续交换细节如上,所以第三轮交换结果为[3, 2, 5, 6, 7, 9]
    数据结构和算法(十)冒泡排序
    第四轮交换结果为[2, 3, 5, 6, 7, 9]
    数据结构和算法(十)冒泡排序
    第五轮交换结果为[2, 3, 5, 6, 7, 9]
    数据结构和算法(十)冒泡排序
    到此为止,元素变成有序的了,这就是冒泡排序的整体思路。

python实现冒泡排序

def bubble_sort(arr):
	loop_count = 0
	for j in range(len(arr) - 1):
		for i in range(len(arr) - 1 - j):
			loop_count += 1
			if arr[i] > arr[i+1]:
				arr[i], arr[i+1] = arr[i+1], arr[i]
			print("第{}趟的第{}次交换的结果:{}".format(j+1, i+1, arr))
		print("第{}趟的结果:{}".format(j+1, arr))
		print("*"*20)
	print("循环次数为:{}".format(loop_count))
	return arr


if __name__ == '__main__':
	arr = [5,9,3,6,2,7]
	print(bubble_sort(arr))

结果

1趟的第1次交换的结果:[5, 9, 3, 6, 2, 7]1趟的第2次交换的结果:[5, 3, 9, 6, 2, 7]1趟的第3次交换的结果:[5, 3, 6, 9, 2, 7]1趟的第4次交换的结果:[5, 3, 6, 2, 9, 7]1趟的第5次交换的结果:[5, 3, 6, 2, 7, 9]1趟的结果:[5, 3, 6, 2, 7, 9]
********************2趟的第1次交换的结果:[3, 5, 6, 2, 7, 9]2趟的第2次交换的结果:[3, 5, 6, 2, 7, 9]2趟的第3次交换的结果:[3, 5, 2, 6, 7, 9]2趟的第4次交换的结果:[3, 5, 2, 6, 7, 9]2趟的结果:[3, 5, 2, 6, 7, 9]
********************3趟的第1次交换的结果:[3, 5, 2, 6, 7, 9]3趟的第2次交换的结果:[3, 2, 5, 6, 7, 9]3趟的第3次交换的结果:[3, 2, 5, 6, 7, 9]3趟的结果:[3, 2, 5, 6, 7, 9]
********************4趟的第1次交换的结果:[2, 3, 5, 6, 7, 9]4趟的第2次交换的结果:[2, 3, 5, 6, 7, 9]4趟的结果:[2, 3, 5, 6, 7, 9]
********************5趟的第1次交换的结果:[2, 3, 5, 6, 7, 9]5趟的结果:[2, 3, 5, 6, 7, 9]
********************
循环次数为:15
[2, 3, 5, 6, 7, 9]

冒泡排序第一次优化

上面可以看出,第四轮之后序列就会变成有序的了,但是程序还会继续执行下去。对于这种情况如果我们能判断出数列已经有序,并且做出标记,剩下的几轮排序就可以不必执行,提早结束工作。

def bubble_sort(arr):
	for j in range(len(arr) - 1):
		# 标记,判断元素是否需要交换,默认有序 设为True
		is_sort = True
		for i in range(len(arr) - 1 - j):
			if arr[i] > arr[i+1]:
				arr[i], arr[i+1] = arr[i+1], arr[i]
				# 有交换 说明无序 设为False
				is_sort = False
		# 如果有序 跳出循环
		if is_sort:
			break

	return arr


if __name__ == '__main__':
	arr = [5,9,3,6,2,7]
	print(bubble_sort(arr))

冒泡排序第二次优化

为了说明问题,使用一个新序列[3,4,2,1,5,6,7,8]

按照冒泡排序过程 第一轮结果为[3,2,1,4,5,6,7,8],我们发现后面 4,5,6,7,8已经有序了,按照常规冒泡,还会依次比较有序的序列,每一轮做很多无用功。

这种情况的关键点在于有序和无序区的界线。

按照现有的逻辑,有序区的长度和排序的轮数是相等的。比如第一轮排序过后的有序区长度是1,第二轮排序过后的有序区长度是2 ……

实际上,数列真正的有序区可能会大于这个长度,比如例子中仅仅第二轮,后面5个元素实际都已经属于有序区。因此后面的许多次元素比较是没有意义的。

如何避免这种情况呢?我们可以在每一轮排序的最后,记录下最后一次元素交换的位置,那个位置也就是无序数列的边界,再往后就是有序区了。循环只循环到临界点,减少了循环次数,达到优化目的。

代码实现

def bubble_sort(arr):
	loop_count = 0
	# 最后一个交换的位置
	last_change_index = 0 
	# 有序和无序的分界线
	sort_border = len(arr) - 1
	for j in range(len(arr) - 1):
	    # 标记,判断元素是否需要交换,默认有序 设为True
		is_sort = True
		for i in range(sort_border):
			loop_count += 1
			if arr[i] > arr[i+1]:
			    arr[i], arr[i+1] = arr[i+1], arr[i]
			    # 有交换 说明无序 设为False
			    is_sort = False
			    last_change_index = i
	    # 如果有序 跳出循环
		if is_sort:
			break
		# 最后一个交换的位置就是边界
		sort_border = last_change_index 
	print("循环次数为:{}".format(loop_count))
	return arr


if __name__ == '__main__':
    arr = [5,9,3,6,2,7]
    print(bubble_sort(arr))

结果

循环次数为:12
[2, 3, 5, 6, 7, 9]

冒泡排序的变形——鸡尾酒排序

至于为什么叫鸡尾酒排序,我也没太理解,看一下*说的吧数据结构和算法(十)冒泡排序
通俗理解就是双向冒泡排序,就是它可以从两个方向进行排序,第一次从左到右,第二次从右到左,第三次再从左到右…,像钟摆一样,来回摆动。

代码实现

# 简版
def bubble_sort(arr):
	for j in range(len(arr) - 1):
	    # 标记,判断元素是否需要交换,默认有序 设为True
		is_sort = True
		for i in range(len(arr) - 1 - j):
			if arr[i] > arr[i+1]:
			    arr[i], arr[i+1] = arr[i+1], arr[i]
			    # 有交换 说明无序 设为False
			    is_sort = False
	    # 如果有序 跳出循环
		if is_sort:
			break

		is_sort = True
		for k in range(len(arr) - 1-j, 0, -1):
			if arr[k] < arr[k-1]:
			    arr[k], arr[k-1] = arr[k-1], arr[k]
			    # 有交换 说明无序 设为False
			    is_sort = False
	    # 如果有序 跳出循环
		if is_sort:
			break
	return arr
# 优化版
def bubble_sort(arr):
	# 记录右侧最后一个交换的位置
	right_last_change_index = 0 
	# 右侧有序和无序的分界线
	right_sort_border = len(arr) - 1
	# 记录左侧最后一个交换的位置
	left_last_change_index = 0 
	# 左侧有序和无序的分界线
	left_sort_border = 0
	for j in range(len(arr) - 1):
	    # 标记,判断元素是否需要交换,默认有序 设为True
		is_sort = True
		for i in range(right_sort_border):
			if arr[i] > arr[i+1]:
			    arr[i], arr[i+1] = arr[i+1], arr[i]
			    # 有交换 说明无序 设为False
			    is_sort = False
			    right_last_change_index = i
	    # 如果有序 跳出循环
		if is_sort:
			break
		# 最后一个交换的位置就是边界
		right_sort_border = right_last_change_index

		is_sort = True
		for k in range(right_sort_border, left_sort_border, -1):
			if arr[k] < arr[k-1]:
			    arr[k], arr[k-1] = arr[k-1], arr[k]
			    # 有交换 说明无序 设为False
			    is_sort = False
			    left_last_change_index = k
	    # 如果有序 跳出循环
		if is_sort:
			break
		# 最后一个交换的位置就是边界
		left_sort_border = left_last_change_index
	return arr

鸡尾酒排序等于是冒泡排序的轻微变形。不同的地方在于从低到高然后从高到低,而冒泡排序则仅从低到高去比较序列里的每个元素。他可以得到比冒泡排序稍微好一点的性能,原因是冒泡排序只从一个方向进行比对(由低到高),每次循环只移动一个项目。

以序列(2,3,4,5,1)为例,鸡尾酒排序只需要访问一次序列就可以完成排序,但如果使用冒泡排序则需要四次。但是在随机数序列的状态下,鸡尾酒排序与冒泡排序的效率与其他众多排序算法相比均比较低。

鸡尾酒排序最糟或是平均所花费的次数都是o(n^2),但如果序列在一开始已经大部分排序过的话,会接近O(n)。

时间复杂度

  • 最坏时间复杂度O(n^2)
  • 最优时间复杂度O(n) (表示遍历一次发现没有任何可以交换的元素,排序结束。)

稳定性

什么是稳定性?
稳定性就是会让原本有相等键值的纪录维持相对次序。也就是如果一个排序算法是稳定的,当有两个相等键值的纪录R和S,且在原本的列表中R出现在S之前,在排序过的列表中R也将会是在S之前。

比如有一个序列 5,2,3,3,4,1。第一个3暂且叫3’,第二个3叫3",经过稳定排序算法为:5,2,3’,3",4,1,两个3的相对位置没有改变。不稳定排序算法为:5,2,3",3’,4,1

冒泡排序算法是稳定的。