欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

数据结构与算法(Python版) | (8) 递归(上)

程序员文章站 2022-05-26 16:14:21
...

本专栏主要基于北大的数据结构与算法教程(Python版)进行整理,包括课程笔记和OJ作业。

课程链接

1. 什么是递归

定义

  • 递归是一种解决问题的方法,其精髓在于:
    1)将问题分解为规模更小的相同问题
    2) 持续分解,直到问题规模小到可以用非常简单直接的方式来解决。
    3) 递归的问题分解方式非常独特,其算法方面的明显特征就是:在算法流程中调用自身
  • 递归为我们提供了一种对复杂问题的优雅解决方案,精妙的递归算法常会出奇简单 ,令人赞叹。

初识递归:数列求和

  • 问题:给定一个列表,返回所有数的和:
    列表中数的个数不定,需要一个循环和一个累加 变量来迭代求和。
  • 程序很简单,但假如没有循环语句?
    既不能用for,也不能用while。 还能对不确定长度的列表求和么?
def listsum(numList):
	theSum = 0
	for i in numList:
		theSum = theSum + i
	return theSum
  • 我们认识到求和实际上最终是由一次次的加法实现的,而加法恰有2个操作数,这个是确定的。
  • 看看怎么想办法,将问题规模较大的列表求和,分解为规模较小而且固定的2个数求和(加法)?
    同样是求和问题,但规模发生了变化,符合递归解决问题的特征!
  • 换个方式来表达数列求和:全括号表达式 (1+(3+(5+(7+9))))
  • 上面这个式子,最内层的括号(7+9),这 是无需循环即可计算的,实际上整个求和 的过程是这样(每次只计算两个数的和):
    数据结构与算法(Python版) | (8) 递归(上)
  • 观察上述过程中所包含的重复模式,可以把求和问题归纳成这样:
    数列的和=“首个数”+“余下数列”的和
  • 如果数列包含的数少到只有1个的话,它的和就是这个数了
    这是规模小到可以做最简单的处理
    数据结构与算法(Python版) | (8) 递归(上)
  • 上面的递归算法变成程序
def listsum(numList):
	if len(numList) == 1:  #最小规模
		return numList[0]
	else:
		return numList[0] + listSum(numList[1:]) #分解问题 减小规模(列表切片); 调用自身。
  • 要点
    1)问题分解为更小规模的相同问题,并表现为 “调用自身
    2)对“最小规模”问题的解决:简单直接

递归程序如何被执行?

  • 递归函数调用和返回过程的链条
    数据结构与算法(Python版) | (8) 递归(上)

递归“三定律”

  • 为了向阿西莫夫的“机器人三定律”致敬 ,递归算法也总结出“三定律”
    1)递归算法必须有一个基本结束条件(最小规 模问题的直接解决)
    2)递归算法必须能改变状态向基本结束条件演 进(减小问题规模)
    3)递归算法必须调用自身(解决减小了规模的相同问题)

  • 数列求和问题首先具备了基本结束条件: 当列表长度为1的时候,直接输出所包含的唯一数

  • 数列求和处理的数据对象是一个列表,而基本结束条件是长度为1的列表,那递归算法就要改变列表并向长度为1的状态演进
    我们看到其具体做法是将列表长度减少1。

  • 调用自身是递归算法中最难理解的部分,实际上我们理解为“问题分解成了规模更小的相同问题”就可以了。
    在数列求和算法中就是“更短数列的求和问题”

2. 递归的应用:任意进制转换

整数转换为任意进制

  • 这个在数据结构栈里讨论过的算法,又回来了!
    递归和栈,一定有关联

  • 如果上次你被“入栈”“出栈”搞得挺晕乎的话,这次递归算法一定会让你感到清新
    而且这次我们要解决从二进制到十六进制的任意进制转换

  • 我们用最熟悉的十进制分析下这个问题
    1)十进制有十个不同符号:convString = “0123456789”
    2)比十小的整数,转换成十进制,直接查表就可以 了:convString[n]
    3) 想办法把比十大的整数,拆成一系列比十小的整数,逐个查表:比如七百六十九,拆成七、六、九,查表得到 769就可以了。

  • 所以,在递归三定律里,我们找到了“基 本结束条件”,就是小于十的整数
    拆解整数的过程就是向“基本结束条件”演进的 过程

  • 我们用整数除,和求余数两个计算来将整数一步步拆开:
    1)除以“进制基base”(// base)
    2)对“进制基”求余数(% base)

  • 问题就分解为:
    1)余数总小于“进制基base”,是“基本结束条件 ”,可直接进行查表转换
    2)整数商成为“更小规模”的相同问题,通过递归调用自身解决。
    数据结构与算法(Python版) | (8) 递归(上)

  • 代码

def toStr(n,base):
convertString = "0123456789ABCDEF"
	if n<base:
		return covertString[n] #最小规模
	else:
		return toStr(n//base,base) + covertString[n%base] #减小规模,调用自身

3. 递归调用的实现

递归调用实现

  • 当一个函数被调用的时候,系统会把调用时的现场数据压入到系统调用栈;每次调用,压入栈的现场数据称为栈帧;当函数返回时,要从调用栈的栈顶取得返回地址
    ,恢复现场,弹出栈帧,按地址返回(后进先出)。
    数据结构与算法(Python版) | (8) 递归(上)

Python中的递归深度限制

  • 在调试递归算法程序的时候经常会碰到这样的错误:RecursionError
    递归的层数太多,系统调用栈容量有限
    数据结构与算法(Python版) | (8) 递归(上)
  • 这时候要检查程序中是否忘记设置基本结 束条件,导致无限递归
    或者向基本结束条件演进太慢,导致递归层数太多,调用栈溢出。
def tell_story():
	print("从前有座山,山里有座庙,庙里有个老和尚,他在讲:")
	tell_story()
print("给你讲个故事")
tell_story()
  • 在Python内置的sys模块可以获取和调整最大递归深度
    数据结构与算法(Python版) | (8) 递归(上)

递归的故事

数据结构与算法(Python版) | (8) 递归(上)

4. 递归可视化:分形树

递归可视化:图示

  • 前面的种种递归算法展现了其简单而强大 的一面,但还是难有个直观的概念
  • 下面我们通过递归作图来展现递归调用的 视觉影像
  • Python的海龟作图系统turtle module
    1)Python内置,随时可用,以LOGO语言的创意为 基础
    2)其意象为模拟海龟在沙滩上爬行而留下的足迹:
    爬行:forward(n); backward(n)
    转向:left(a); right(a)
    抬笔放笔:penup(); pendown()
    笔属性:pensize(s); pencolor©
  • 示例代码
import turtle
t = turtle.Turtle()

#开始做图
t.forward(100) #前行100 (默认向右)
turtle.done() #作图结束

数据结构与算法(Python版) | (8) 递归(上)

import turtle

t = turtle.Turtle()

for i in range(4):
	t.forward(100) #当前方向前进100
	t.right(90) #右转90度
turtle.done()

数据结构与算法(Python版) | (8) 递归(上)

import turtle

t = turtle.Turtle()

t.pencolor('red')
t.pensize(3) 

for i in range(5):
	t.forward(100) #当前方向前进100
	t.right(144) #右转144度
t.hideturtle()
turtle.done()

数据结构与算法(Python版) | (8) 递归(上)

一个递归作图的例子:螺旋

import turtle
t = turtle.Turtle()

def drawSpiral(t,linelen):
	if linelen > 0: #最小规模,0直接退出
		t.forward(linelen)
		t.right(90)
		drawSpiral(t,linelen-5)   #减小规模 长度-5 调用自身
drawSpiral(t,100)

turtle.done()

数据结构与算法(Python版) | (8) 递归(上)

分形树:自相似递归图形

  • 分形Fractal,是1975年由Mandelbrot 开创的新学科
    “一个粗糙或零碎的几何形状,可以分成数个部 分,且每一部分都(至少近似地)是整体缩小后 的形状”,即具有自相似的性质。
    数据结构与算法(Python版) | (8) 递归(上)
  • 自然界中能找到众多具有分形性质的物体
    海岸线、山脉、闪电、云朵、雪花、树
    http://paulbourke.net/fractals/googleearth/
    http://recursivedrawing.com/
    数据结构与算法(Python版) | (8) 递归(上)

自然界不是平滑的

数据结构与算法(Python版) | (8) 递归(上)

分形树:自相似递归图形

  • 自然现象中所具备的分形特性,使得计算机可以通过分形算法生成非常逼真的自然场景(如游戏中的场景)
  • 分形是在不同尺度上都具有相似性的事物
    我们能看出一棵树的每个分叉和每条树枝,实际 上都具有整棵树的外形特征(也是逐步分叉的)
  • 这样,我们可以把树分解为三个部分:树 干、左边的小树、右边的小树(左右小树,又可以分为树干,左边的小小树,右边的小小树…)
    分解后,正好符合递归的定义:对自身的调用
    数据结构与算法(Python版) | (8) 递归(上)
  • 代码
import turtle

def tree(branch_len):
	if branch_len > 5: #树干长度<=5就不再继续画了 即递归结束条件
		t.forward(branch_len) #画树干 
		t.right(20) #右倾斜20度
		tree(branch_len - 15) #画右边的小树 树干长度-15
		t.left(40) #向左回40度 即左倾斜20度
		tree(branch_len - 15) #画左边的小树 树干长度-15
		t.right(20) #右回20度 回正
		t.backward(branch_len) #退回原位置

t = turtle.Turtle()
t.left(90)
t.penup()
t.backward(100)
t.pendown()
t.pencolor('green')
t.pensize(2)	
tree(75) #画树干长度75的二叉树
t.hideturtle()
turtle.done()

5. 递归可视化:谢尔宾斯基三角形

谢尔宾斯基Sierpinski三角形

  • 分形构造,平面称谢尔宾斯基三角形,立体称谢尔宾斯基金字塔
    实际上,真正的谢尔宾斯基三角形是完全不可见 的,其面积为0,但周长无穷,是介于一维和二 维之间的分数维(约1.585维)构造。(谢尔宾斯基金字塔体积为0,表面积无穷)
    数据结构与算法(Python版) | (8) 递归(上)

谢尔宾斯基三角形:作图思路

  • 根据自相似特性,谢尔宾斯基三角形是由 3个尺寸减半的谢尔宾斯基三角形按照品字形拼叠而成。
    由于我们无法真正做出谢尔宾斯基三角形( degree->∞,看不到了),只能做degree有限的近似图形。
    数据结构与算法(Python版) | (8) 递归(上)

  • 在degree有限的情况下,degree=n的三角形,是由3个degree=n-1的三角形按照品字形拼叠而成。
    同时,这3个degree=n-1的三角形边长均为 degree=n的三角形的一半(规模减小)。
    当degree=0,则就是一个等边三角形,这是递 归基本结束条件

  • 代码

import turtle
def sierpinski(degree,points):
	colormap = ['blue','red','green','white','yellow','orange']
	drawTriangle(points,colormap[degree]) #绘制等边三角形 points字典 存储三个顶点坐标
	if degree > 0: #最小规模 0 直接退出;结束条件
		#减小规模 getMid边长减半(原来的两个顶点取中点)
		#调用自身 左、上、右次序
		sierpinski(degree-1,{'left':points['left'],'top':getMid(points['left'],points['top']),'right':getMid(points['left'],points['right'])})
		sierpinski(degree-1,{'left':getMid(points['left'],points['top']),'top':points['top'],'right':getMid(points['top'],points['right'])})
		sierpinski(degree-1,{'left':getMid(points['left'],points['right']),'top':getMid(points['top'],points['right']),'right':points['right']})

def drawTriangle(points,color): #绘制等边三角形
    t.fillcolor(color)
    t.up()
    t.goto(points['top'])
    t.down()
    t.begin_fill()
    t.goto(points['left'])
    t.goto(points['right'])
    t.goto(points['top'])
    t.end_fill()

def getMid(p1,p2): #取两个点中点
    return ( (p1[0]+p2[0]) / 2, (p1[1] + p2[1]) / 2)

t = turtle.Turtle()   
points = {'left':(-200,-100),'top':(0,200),'right':(200,-100)} #外轮廓三个顶点
sierpinski(5,points) #画degree=5的三角形
turtle.done()

数据结构与算法(Python版) | (8) 递归(上)

6. 递归的应用:汉诺塔

复杂递归问题:汉诺塔

  • 汉诺塔问题是法国数学家Edouard Lucas于 1883年,根据传说提出来的。
  • 传说在一个印度教寺庙里,有3根柱子,其中 一根套着64个由小到大的黄金盘片,僧侣们 的任务就是要把这一叠黄金盘从一根柱子搬 到另一根,但有两个规则:
    1)一次只能搬1个盘子
    2)大盘子不能叠在小盘子上
  • 神的旨意说一旦这些盘子完成迁移:寺庙将会坍塌,世界将会毁灭…神的旨意是千真万确的!

汉诺塔问题

  • 虽然这些黄金盘片跟世界末日有着神秘的联系,但我们却不必太担心,据计算,要搬完这64个盘片(宇宙至今的寿命才170亿年):
    数据结构与算法(Python版) | (8) 递归(上)
  • 我们还是从递归三定律来分析汉诺塔问题
    基本结束条件(最小规模问题),如何减小规模,调用自身

汉诺塔问题:分解为递归形式

  • 假设我们有5个盘子,穿在1#柱,需要挪 到3#柱
    1)如果能有办法把最上面的一摞4个盘子统统挪到 2#柱,那问题就好解决了:
    2)把剩下的最大号盘子直接从1#柱挪到3#柱
    3)再用同样的办法把2#柱上的那一摞4个盘子挪到3#柱,就完成了整个移动
    数据结构与算法(Python版) | (8) 递归(上)

汉诺塔问题:分析

  • 接下来问题就是解决4个盘子如何能从1# 挪到2#?
    1)此时问题规模已经减小!
    2)同样是想办法把上面的一摞3个盘子挪到3#柱,
    3)把剩下最大号盘子从1#挪到2#柱,
    4)再用同样的办 法把一摞3个盘子从3#挪到2#柱
  • 一摞3个盘子的挪动也照此:分为上面一摞2个,和下面最大号盘子
  • 那么2个盘子怎么移动?
  • 不行,就再分解为1个盘子的移动(直接移动即可)

汉诺塔问题:递归思路

  • 将盘片塔从开始柱,经由中间柱,移动到 目标柱:
    1)首先将上层N-1个盘片的盘片塔,从开始柱,经由目标柱,移动到中间柱;
    2)然后将第N个(最大的)盘片,从开始柱,(直接)移动到目标柱;
    3)最后将放置在中间柱的N-1个盘片的盘片塔,经 由开始柱,移动到目标柱。

  • 基本结束条件,也就是最小规模问题是:1个盘片的移动问题

  • 代码( 上面的思路用Python写出来,几乎跟语 言描述一样)

def moveTower(height,fromPole,withPole,toPole):
	if height >=1:
		moveTower(height-1,fromPole,toPole,withPole)
		moveDisk(height,fromPole,toPole)
		moveTower(height-1,withPole,fromPole,toPole)

def moveDisk(disk,fromPole,toPole):
	print(f"Moving Disk[{disk}] from {fromPole} to {toPole}") #格式化字符串

moveTower(3,"#1","#2","#3")

数据结构与算法(Python版) | (8) 递归(上)

7. 递归的应用:探索迷宫

探索迷宫

  • 将海龟放在迷宫中间,如何能找到出口
  • 首先,我们将整个迷宫的空间(矩形)分 为行列整齐的方格,区分出墙壁和通道。
    给每个方格具有行列位置,并赋予“墙壁”、“ 通道”的属性

迷宫的数据结构

  • 考虑用矩阵方式来实现迷宫数据结构
  1. 采用“数据项为字符列表的列表”这种两级列表 的方式来保存方格内容
  2. 采用不同字符来分别代表“墙壁+”、“通道(空格)” 、“海龟投放点S”
    3)可以在一个文本文件中编辑一个迷宫,然后再从文本文件逐行读入迷宫数据
  • Maze Class
class Maze:
	def __init__(self,mazeFileName):
		rowsInMaze = 0
		columnsInMaze = 0
		self.mazelist = []
		mazeFile = open(mazeFileName,'r')
		for line in mazeFile: #遍历每一行
			rowList = []
			col = 0
			for ch in line[:-1]: #遍历每一行字符列表中的每个字符(:-1 除去末尾换行符)
				rowList.append(ch)
				if ch == 'S':
					self.startRow = rowsInMaze
					self.startCol = col
				col = col + 1
			rowsInMaze = rowsInMaze + 1
			self.mazelist.append(rowList)
			columnsInMaze = len(rowList)
  • 读入数据文件成功后
    mazelist如下图示意:
    数据结构与算法(Python版) | (8) 递归(上)

探索迷宫:算法思路

  • 确定了迷宫数据结构之后,我们知道,对 于海龟来说,其身处某个方格之中
  1. 它所能移动的方向,必须是向着通道的方向
  2. 如果某个方向是墙壁方格,就要换一个方向移动
    数据结构与算法(Python版) | (8) 递归(上)
  • 这样,探索迷宫的递归算法思路如下:
  1. 将海龟从原位置向北移动一步,以新位置递归调 用探索迷宫寻找出口;
  2. 如果上面的步骤找不到出口,那么将海龟从原位置向南移动一步,以新位置递归调用探索迷宫;
  3. 如果向南还找不到出口,那么将海龟从原位置向西移动一步,以新位置递归调用探索迷宫;
  4. 如果向西还找不到出口,那么将海龟从原位置向东移动一步,以新位置递归调用探索迷宫;
  5. 如果上面四个方向都找不到出口,那么这个迷宫 没有出口!
  • 思路看起来很完美,但有些细节至关重要
  1. 如果我们向某个方向(如北)移动了海龟,那么 如果新位置的北正好是一堵墙壁,那么在新位置 上的递归调用就会让海龟向南尝试
  2. 可是新位置的南边一格,正好就是递归调用之前的原位置,这样就陷入了无限递归的死循环之中
    数据结构与算法(Python版) | (8) 递归(上)
  • 所以需要有个机制记录海龟所走过(探索过)的路径
    沿途洒“面包屑”,一旦前进方向发现“面包屑 ”,就不能再踩上去,而必须换下一个方向尝试
    对于递归调用来说,就是某方向的方格上发现“面包屑”,就立即从递归调用返回上一级。

  • 递归调用的“基本结束条件”归纳如下:
    1)海龟碰到“墙壁”方格,递归调用结束,返回失 败;
    2)海龟碰到“面包屑”方格,表示此方格已访问过,递归调用结束,返回失败;
    3)海龟碰到“出口”方格,即“位于边缘的通道”方格,递归调用结束,返回成功!
    4) 海龟在四个方向上探索都失败,递归调用结束,返回失败

探索迷宫:辅助的动画过程

  • 为了让海龟在迷宫图里跑起来,我们给迷宫数据结构Maze Class添加一些成员和方法
    数据结构与算法(Python版) | (8) 递归(上)
  • 探索函数
def searchFrom(maze,startRow,startColumn):
	#1. 碰到墙壁 返回失败
	maze.updatePosition(startRow,startColumn)
	if maze[startRow][startColumn] == OBSTACLE:
		return False
	
	#2. 碰到面包屑,或者死胡同,返回失败
	if maze[startRow][startColumn] == TRIED or maze[startRow][startColumn] == DEAD_END:
		return False
	
	#3. 碰到了出口,返回成功!
	if maze.isExit(startRow,startColumn):
		maze.updatePosition(startRow,startColumn,PART_OF_PATH)
		return True
	
	#4. 洒一下面包屑,继续探索
	maze.updatePosition(startRow,startColumn,TRIED)
	
	#向北南西东4个方向依次探索 or具有短路效应(第一个表达式为True其余表达式都不会计算,第一个为False时,才会计算第二个...)
	found = searchFrom(maze,startRow-1,startColumn) or searchFrom(maze,startRow+1,startColumn) or searchFrom(maze,startRow,startColumn-1) or searchFrom(maze,startRow,startColumn+1)
    
    #如果探索成功 标记当前点(为可行路径中的一点),失败则标记为死胡同
    if found:
    	maze.updatePosition(startRow,startColumn,PART_OF_PATH)
    else:
    	maze.updatePosition(startRow,startColumn,DEAD_END)
    return found
  • 完整代码
import turtle

PART_OF_PATH = 'O'
TRIED = '.'
OBSTACLE = '+'
DEAD_END = '-'

class Maze:
    def __init__(self,mazeFileName):
        rowsInMaze = 0
        columnsInMaze = 0
        self.mazelist = []
        mazeFile = open(mazeFileName,'r')
        rowsInMaze = 0
        for line in mazeFile:
            rowList = []
            col = 0
            for ch in line[:-1]:
                rowList.append(ch)
                if ch == 'S':
                    self.startRow = rowsInMaze
                    self.startCol = col
                col = col + 1
            rowsInMaze = rowsInMaze + 1
            self.mazelist.append(rowList)
            columnsInMaze = len(rowList)

        self.rowsInMaze = rowsInMaze
        self.columnsInMaze = columnsInMaze
        self.xTranslate = -columnsInMaze/2
        self.yTranslate = rowsInMaze/2
        self.t = turtle.Turtle()
        self.t.shape('turtle')
        self.wn = turtle.Screen()
        self.wn.setworldcoordinates(-(columnsInMaze-1)/2-.5,-(rowsInMaze-1)/2-.5,(columnsInMaze-1)/2+.5,(rowsInMaze-1)/2+.5)

    def drawMaze(self):
        self.t.speed(10)
        for y in range(self.rowsInMaze):
            for x in range(self.columnsInMaze):
                if self.mazelist[y][x] == OBSTACLE:
                    self.drawCenteredBox(x+self.xTranslate,-y+self.yTranslate,'orange')
        self.t.color('black')
        self.t.fillcolor('blue')

    def drawCenteredBox(self,x,y,color):
        self.t.up()
        self.t.goto(x-.5,y-.5)
        self.t.color(color)
        self.t.fillcolor(color)
        self.t.setheading(90)
        self.t.down()
        self.t.begin_fill()
        for i in range(4):
            self.t.forward(1)
            self.t.right(90)
        self.t.end_fill()

    def moveTurtle(self,x,y):
        self.t.up()
        self.t.setheading(self.t.towards(x+self.xTranslate,-y+self.yTranslate))
        self.t.goto(x+self.xTranslate,-y+self.yTranslate)

    def dropBreadcrumb(self,color):
        self.t.dot(10,color)

    def updatePosition(self,row,col,val=None):
        if val:
            self.mazelist[row][col] = val
        self.moveTurtle(col,row)

        if val == PART_OF_PATH:
            color = 'green'
        elif val == OBSTACLE:
            color = 'red'
        elif val == TRIED:
            color = 'black'
        elif val == DEAD_END:
            color = 'red'
        else:
            color = None

        if color:
            self.dropBreadcrumb(color)

    def isExit(self,row,col):
        return (row == 0 or
                row == self.rowsInMaze-1 or
                col == 0 or
                col == self.columnsInMaze-1 )

    def __getitem__(self,idx):
        return self.mazelist[idx]


def searchFrom(maze, startRow, startColumn):
    # try each of four directions from this point until we find a way out.
    # base Case return values:
    #  1. We have run into an obstacle, return false
    maze.updatePosition(startRow, startColumn)
    if maze[startRow][startColumn] == OBSTACLE :
        return False
    #  2. We have found a square that has already been explored
    if maze[startRow][startColumn] == TRIED or maze[startRow][startColumn] == DEAD_END:
        return False
    # 3. We have found an outside edge not occupied by an obstacle
    if maze.isExit(startRow,startColumn):
        maze.updatePosition(startRow, startColumn, PART_OF_PATH)
        return True
    maze.updatePosition(startRow, startColumn, TRIED)
    # Otherwise, use logical short circuiting to try each direction
    # in turn (if needed)
    found = searchFrom(maze, startRow-1, startColumn) or \
            searchFrom(maze, startRow+1, startColumn) or \
            searchFrom(maze, startRow, startColumn-1) or \
            searchFrom(maze, startRow, startColumn+1)
    if found:
        maze.updatePosition(startRow, startColumn, PART_OF_PATH)
    else:
        maze.updatePosition(startRow, startColumn, DEAD_END)
    return found


myMaze = Maze('maze2.txt')
myMaze.drawMaze()
myMaze.updatePosition(myMaze.startRow,myMaze.startCol)

searchFrom(myMaze, myMaze.startRow, myMaze.startCol)

迷宫文件maze2.txt
数据结构与算法(Python版) | (8) 递归(上)