数据结构与算法(Python版) | (8) 递归(上)

程序员文章站 2022-05-26 16:14:21

...

本专栏主要基于北大的数据结构与算法教程(Python版)进行整理，包括课程笔记和OJ作业。

课程链接

1. 什么是递归

定义

递归是一种解决问题的方法，其精髓在于：
1）将问题分解为规模更小的相同问题，
2）持续分解，直到问题规模小到可以用非常简单直接的方式来解决。
3）递归的问题分解方式非常独特，其算法方面的明显特征就是:在算法流程中调用自身。
递归为我们提供了一种对复杂问题的优雅解决方案，精妙的递归算法常会出奇简单，令人赞叹。

初识递归:数列求和

问题:给定一个列表，返回所有数的和：
列表中数的个数不定，需要一个循环和一个累加变量来迭代求和。
程序很简单，但假如没有循环语句?
既不能用for，也不能用while。还能对不确定长度的列表求和么?

def listsum(numList):
	theSum = 0
	for i in numList:
		theSum = theSum + i
	return theSum

我们认识到求和实际上最终是由一次次的加法实现的，而加法恰有2个操作数，这个是确定的。
看看怎么想办法，将问题规模较大的列表求和，分解为规模较小而且固定的2个数求和(加法)?
同样是求和问题，但规模发生了变化，符合递归解决问题的特征!
换个方式来表达数列求和:全括号表达式 (1+(3+(5+(7+9))))
上面这个式子，最内层的括号(7+9)，这是无需循环即可计算的，实际上整个求和的过程是这样(每次只计算两个数的和):
观察上述过程中所包含的重复模式，可以把求和问题归纳成这样:
数列的和=“首个数”+“余下数列”的和
如果数列包含的数少到只有1个的话，它的和就是这个数了
这是规模小到可以做最简单的处理
上面的递归算法变成程序

def listsum(numList):
	if len(numList) == 1:  #最小规模
		return numList[0]
	else:
		return numList[0] + listSum(numList[1:]) #分解问题 减小规模（列表切片）； 调用自身。

要点
1）问题分解为更小规模的相同问题，并表现为 “调用自身”
2）对“最小规模”问题的解决:简单直接

递归程序如何被执行?

递归函数调用和返回过程的链条

递归“三定律”

为了向阿西莫夫的“机器人三定律”致敬，递归算法也总结出“三定律”
1）递归算法必须有一个基本结束条件(最小规模问题的直接解决)
2）递归算法必须能改变状态向基本结束条件演进(减小问题规模)
3）递归算法必须调用自身(解决减小了规模的相同问题)
数列求和问题首先具备了基本结束条件: 当列表长度为1的时候，直接输出所包含的唯一数
数列求和处理的数据对象是一个列表，而基本结束条件是长度为1的列表，那递归算法就要改变列表并向长度为1的状态演进。
我们看到其具体做法是将列表长度减少1。
调用自身是递归算法中最难理解的部分，实际上我们理解为“问题分解成了规模更小的相同问题”就可以了。
在数列求和算法中就是“更短数列的求和问题”

2. 递归的应用:任意进制转换

整数转换为任意进制

这个在数据结构栈里讨论过的算法，又回来了!
递归和栈，一定有关联
如果上次你被“入栈”“出栈”搞得挺晕乎的话，这次递归算法一定会让你感到清新
而且这次我们要解决从二进制到十六进制的任意进制转换
我们用最熟悉的十进制分析下这个问题
1）十进制有十个不同符号:convString = “0123456789”
2）比十小的整数，转换成十进制，直接查表就可以了:convString[n]
3）想办法把比十大的整数，拆成一系列比十小的整数，逐个查表：比如七百六十九，拆成七、六、九，查表得到 769就可以了。
所以，在递归三定律里，我们找到了“基本结束条件”，就是小于十的整数
拆解整数的过程就是向“基本结束条件”演进的过程
我们用整数除，和求余数两个计算来将整数一步步拆开：
1）除以“进制基base”(// base)
2）对“进制基”求余数(% base)
问题就分解为:
1）余数总小于“进制基base”，是“基本结束条件 ”，可直接进行查表转换
2）整数商成为“更小规模”的相同问题，通过递归调用自身解决。
代码

def toStr(n,base):
convertString = "0123456789ABCDEF"
	if n<base:
		return covertString[n] #最小规模
	else:
		return toStr(n//base,base) + covertString[n%base] #减小规模，调用自身

3. 递归调用的实现

递归调用实现

当一个函数被调用的时候，系统会把调用时的现场数据压入到系统调用栈；每次调用，压入栈的现场数据称为栈帧；当函数返回时，要从调用栈的栈顶取得返回地址
，恢复现场，弹出栈帧，按地址返回（后进先出）。

Python中的递归深度限制

在调试递归算法程序的时候经常会碰到这样的错误:RecursionError
递归的层数太多，系统调用栈容量有限
这时候要检查程序中是否忘记设置基本结束条件，导致无限递归
或者向基本结束条件演进太慢，导致递归层数太多，调用栈溢出。

def tell_story():
	print("从前有座山，山里有座庙，庙里有个老和尚，他在讲：")
	tell_story()
print("给你讲个故事")
tell_story()

在Python内置的sys模块可以获取和调整最大递归深度

递归的故事

数据结构与算法(Python版) | (8) 递归(上)

4. 递归可视化:分形树

递归可视化:图示

前面的种种递归算法展现了其简单而强大的一面，但还是难有个直观的概念
下面我们通过递归作图来展现递归调用的视觉影像
Python的海龟作图系统turtle module
1）Python内置，随时可用，以LOGO语言的创意为基础
2）其意象为模拟海龟在沙滩上爬行而留下的足迹：
爬行:forward(n); backward(n)
转向:left(a); right(a)
抬笔放笔:penup(); pendown()
笔属性:pensize(s); pencolor©
示例代码

import turtle
t = turtle.Turtle()

#开始做图
t.forward(100) #前行100 （默认向右）
turtle.done() #作图结束

数据结构与算法(Python版) | (8) 递归(上)

import turtle

t = turtle.Turtle()

for i in range(4):
	t.forward(100) #当前方向前进100
	t.right(90) #右转90度
turtle.done()

数据结构与算法(Python版) | (8) 递归(上)

import turtle

t = turtle.Turtle()

t.pencolor('red')
t.pensize(3) 

for i in range(5):
	t.forward(100) #当前方向前进100
	t.right(144) #右转144度
t.hideturtle()
turtle.done()

数据结构与算法(Python版) | (8) 递归(上)

一个递归作图的例子:螺旋

import turtle
t = turtle.Turtle()

def drawSpiral(t,linelen):
	if linelen > 0: #最小规模，0直接退出
		t.forward(linelen)
		t.right(90)
		drawSpiral(t,linelen-5)   #减小规模 长度-5 调用自身
drawSpiral(t,100)

turtle.done()

数据结构与算法(Python版) | (8) 递归(上)

分形树:自相似递归图形

分形Fractal，是1975年由Mandelbrot 开创的新学科
“一个粗糙或零碎的几何形状，可以分成数个部分，且每一部分都(至少近似地)是整体缩小后的形状”，即具有自相似的性质。
自然界中能找到众多具有分形性质的物体
海岸线、山脉、闪电、云朵、雪花、树
http://paulbourke.net/fractals/googleearth/
http://recursivedrawing.com/

自然界不是平滑的

数据结构与算法(Python版) | (8) 递归(上)

分形树:自相似递归图形

自然现象中所具备的分形特性，使得计算机可以通过分形算法生成非常逼真的自然场景(如游戏中的场景)
分形是在不同尺度上都具有相似性的事物
我们能看出一棵树的每个分叉和每条树枝，实际上都具有整棵树的外形特征(也是逐步分叉的)
这样，我们可以把树分解为三个部分:树干、左边的小树、右边的小树（左右小树，又可以分为树干，左边的小小树，右边的小小树…）
分解后，正好符合递归的定义:对自身的调用
代码

import turtle

def tree(branch_len):
	if branch_len > 5: #树干长度<=5就不再继续画了 即递归结束条件
		t.forward(branch_len) #画树干 
		t.right(20) #右倾斜20度
		tree(branch_len - 15) #画右边的小树 树干长度-15
		t.left(40) #向左回40度 即左倾斜20度
		tree(branch_len - 15) #画左边的小树 树干长度-15
		t.right(20) #右回20度 回正
		t.backward(branch_len) #退回原位置

t = turtle.Turtle()
t.left(90)
t.penup()
t.backward(100)
t.pendown()
t.pencolor('green')
t.pensize(2)	
tree(75) #画树干长度75的二叉树
t.hideturtle()
turtle.done()

5. 递归可视化:谢尔宾斯基三角形

谢尔宾斯基Sierpinski三角形

分形构造，平面称谢尔宾斯基三角形，立体称谢尔宾斯基金字塔
实际上，真正的谢尔宾斯基三角形是完全不可见的，其面积为0，但周长无穷，是介于一维和二维之间的分数维(约1.585维)构造。(谢尔宾斯基金字塔体积为0，表面积无穷)

谢尔宾斯基三角形:作图思路

根据自相似特性，谢尔宾斯基三角形是由 3个尺寸减半的谢尔宾斯基三角形按照品字形拼叠而成。
由于我们无法真正做出谢尔宾斯基三角形( degree->∞，看不到了)，只能做degree有限的近似图形。
在degree有限的情况下，degree=n的三角形，是由3个degree=n-1的三角形按照品字形拼叠而成。
同时，这3个degree=n-1的三角形边长均为 degree=n的三角形的一半(规模减小)。
当degree=0，则就是一个等边三角形，这是递归基本结束条件
代码

import turtle
def sierpinski(degree,points):
	colormap = ['blue','red','green','white','yellow','orange']
	drawTriangle(points,colormap[degree]) #绘制等边三角形 points字典 存储三个顶点坐标
	if degree > 0: #最小规模 0 直接退出；结束条件
		#减小规模 getMid边长减半（原来的两个顶点取中点）
		#调用自身 左、上、右次序
		sierpinski(degree-1,{'left':points['left'],'top':getMid(points['left'],points['top']),'right':getMid(points['left'],points['right'])})
		sierpinski(degree-1,{'left':getMid(points['left'],points['top']),'top':points['top'],'right':getMid(points['top'],points['right'])})
		sierpinski(degree-1,{'left':getMid(points['left'],points['right']),'top':getMid(points['top'],points['right']),'right':points['right']})

def drawTriangle(points,color): #绘制等边三角形
    t.fillcolor(color)
    t.up()
    t.goto(points['top'])
    t.down()
    t.begin_fill()
    t.goto(points['left'])
    t.goto(points['right'])
    t.goto(points['top'])
    t.end_fill()

def getMid(p1,p2): #取两个点中点
    return ( (p1[0]+p2[0]) / 2, (p1[1] + p2[1]) / 2)

t = turtle.Turtle()   
points = {'left':(-200,-100),'top':(0,200),'right':(200,-100)} #外轮廓三个顶点
sierpinski(5,points) #画degree=5的三角形
turtle.done()

数据结构与算法(Python版) | (8) 递归(上)

6. 递归的应用:汉诺塔

复杂递归问题:汉诺塔

汉诺塔问题是法国数学家Edouard Lucas于 1883年，根据传说提出来的。
传说在一个印度教寺庙里，有3根柱子，其中一根套着64个由小到大的黄金盘片，僧侣们的任务就是要把这一叠黄金盘从一根柱子搬到另一根，但有两个规则:
1）一次只能搬1个盘子
2）大盘子不能叠在小盘子上
神的旨意说一旦这些盘子完成迁移：寺庙将会坍塌，世界将会毁灭…神的旨意是千真万确的!

汉诺塔问题

虽然这些黄金盘片跟世界末日有着神秘的联系，但我们却不必太担心，据计算，要搬完这64个盘片（宇宙至今的寿命才170亿年）:
我们还是从递归三定律来分析汉诺塔问题
基本结束条件(最小规模问题)，如何减小规模，调用自身

汉诺塔问题:分解为递归形式

假设我们有5个盘子，穿在1#柱，需要挪到3#柱
1）如果能有办法把最上面的一摞4个盘子统统挪到 2#柱，那问题就好解决了:
2）把剩下的最大号盘子直接从1#柱挪到3#柱
3）再用同样的办法把2#柱上的那一摞4个盘子挪到3#柱，就完成了整个移动

汉诺塔问题:分析

接下来问题就是解决4个盘子如何能从1# 挪到2#?
1）此时问题规模已经减小!
2）同样是想办法把上面的一摞3个盘子挪到3#柱，
3）把剩下最大号盘子从1#挪到2#柱，
4）再用同样的办法把一摞3个盘子从3#挪到2#柱
一摞3个盘子的挪动也照此:分为上面一摞2个，和下面最大号盘子
那么2个盘子怎么移动?
不行，就再分解为1个盘子的移动（直接移动即可）

汉诺塔问题:递归思路

将盘片塔从开始柱，经由中间柱，移动到目标柱:
1）首先将上层N-1个盘片的盘片塔，从开始柱，经由目标柱，移动到中间柱;
2）然后将第N个(最大的)盘片，从开始柱，（直接）移动到目标柱;
3）最后将放置在中间柱的N-1个盘片的盘片塔，经由开始柱，移动到目标柱。
基本结束条件，也就是最小规模问题是:1个盘片的移动问题
代码（上面的思路用Python写出来，几乎跟语言描述一样）

def moveTower(height,fromPole,withPole,toPole):
	if height >=1:
		moveTower(height-1,fromPole,toPole,withPole)
		moveDisk(height,fromPole,toPole)
		moveTower(height-1,withPole,fromPole,toPole)

def moveDisk(disk,fromPole,toPole):
	print(f"Moving Disk[{disk}] from {fromPole} to {toPole}") #格式化字符串

moveTower(3,"#1","#2","#3")

数据结构与算法(Python版) | (8) 递归(上)

7. 递归的应用:探索迷宫

探索迷宫

将海龟放在迷宫中间，如何能找到出口
首先，我们将整个迷宫的空间(矩形)分为行列整齐的方格，区分出墙壁和通道。
给每个方格具有行列位置，并赋予“墙壁”、“ 通道”的属性

迷宫的数据结构

考虑用矩阵方式来实现迷宫数据结构

采用“数据项为字符列表的列表”这种两级列表的方式来保存方格内容
采用不同字符来分别代表“墙壁+”、“通道(空格)” 、“海龟投放点S”
3）可以在一个文本文件中编辑一个迷宫，然后再从文本文件逐行读入迷宫数据

Maze Class

class Maze:
	def __init__(self,mazeFileName):
		rowsInMaze = 0
		columnsInMaze = 0
		self.mazelist = []
		mazeFile = open(mazeFileName,'r')
		for line in mazeFile: #遍历每一行
			rowList = []
			col = 0
			for ch in line[:-1]: #遍历每一行字符列表中的每个字符（：-1 除去末尾换行符）
				rowList.append(ch)
				if ch == 'S':
					self.startRow = rowsInMaze
					self.startCol = col
				col = col + 1
			rowsInMaze = rowsInMaze + 1
			self.mazelist.append(rowList)
			columnsInMaze = len(rowList)

读入数据文件成功后
mazelist如下图示意:

探索迷宫:算法思路

确定了迷宫数据结构之后，我们知道，对于海龟来说，其身处某个方格之中

它所能移动的方向，必须是向着通道的方向
如果某个方向是墙壁方格，就要换一个方向移动

这样，探索迷宫的递归算法思路如下:

将海龟从原位置向北移动一步，以新位置递归调用探索迷宫寻找出口;
如果上面的步骤找不到出口，那么将海龟从原位置向南移动一步，以新位置递归调用探索迷宫;
如果向南还找不到出口，那么将海龟从原位置向西移动一步，以新位置递归调用探索迷宫;
如果向西还找不到出口，那么将海龟从原位置向东移动一步，以新位置递归调用探索迷宫;
如果上面四个方向都找不到出口，那么这个迷宫没有出口!

思路看起来很完美，但有些细节至关重要

如果我们向某个方向(如北)移动了海龟，那么如果新位置的北正好是一堵墙壁，那么在新位置上的递归调用就会让海龟向南尝试
可是新位置的南边一格，正好就是递归调用之前的原位置，这样就陷入了无限递归的死循环之中

所以需要有个机制记录海龟所走过（探索过）的路径
沿途洒“面包屑”，一旦前进方向发现“面包屑 ”，就不能再踩上去，而必须换下一个方向尝试
对于递归调用来说，就是某方向的方格上发现“面包屑”，就立即从递归调用返回上一级。
递归调用的“基本结束条件”归纳如下:
1）海龟碰到“墙壁”方格，递归调用结束，返回失败;
2）海龟碰到“面包屑”方格，表示此方格已访问过，递归调用结束，返回失败;
3）海龟碰到“出口”方格，即“位于边缘的通道”方格，递归调用结束，返回成功!
4）海龟在四个方向上探索都失败，递归调用结束，返回失败

探索迷宫:辅助的动画过程

为了让海龟在迷宫图里跑起来，我们给迷宫数据结构Maze Class添加一些成员和方法
探索函数

def searchFrom(maze,startRow,startColumn):
	#1. 碰到墙壁 返回失败
	maze.updatePosition(startRow,startColumn)
	if maze[startRow][startColumn] == OBSTACLE:
		return False
	
	#2. 碰到面包屑，或者死胡同，返回失败
	if maze[startRow][startColumn] == TRIED or maze[startRow][startColumn] == DEAD_END:
		return False
	
	#3. 碰到了出口，返回成功！
	if maze.isExit(startRow,startColumn):
		maze.updatePosition(startRow,startColumn,PART_OF_PATH)
		return True
	
	#4. 洒一下面包屑，继续探索
	maze.updatePosition(startRow,startColumn,TRIED)
	
	#向北南西东4个方向依次探索 or具有短路效应（第一个表达式为True其余表达式都不会计算，第一个为False时，才会计算第二个...）
	found = searchFrom(maze,startRow-1,startColumn) or searchFrom(maze,startRow+1,startColumn) or searchFrom(maze,startRow,startColumn-1) or searchFrom(maze,startRow,startColumn+1)
    
    #如果探索成功 标记当前点（为可行路径中的一点），失败则标记为死胡同
    if found:
    	maze.updatePosition(startRow,startColumn,PART_OF_PATH)
    else:
    	maze.updatePosition(startRow,startColumn,DEAD_END)
    return found

完整代码

import turtle

PART_OF_PATH = 'O'
TRIED = '.'
OBSTACLE = '+'
DEAD_END = '-'

class Maze:
    def __init__(self,mazeFileName):
        rowsInMaze = 0
        columnsInMaze = 0
        self.mazelist = []
        mazeFile = open(mazeFileName,'r')
        rowsInMaze = 0
        for line in mazeFile:
            rowList = []
            col = 0
            for ch in line[:-1]:
                rowList.append(ch)
                if ch == 'S':
                    self.startRow = rowsInMaze
                    self.startCol = col
                col = col + 1
            rowsInMaze = rowsInMaze + 1
            self.mazelist.append(rowList)
            columnsInMaze = len(rowList)

        self.rowsInMaze = rowsInMaze
        self.columnsInMaze = columnsInMaze
        self.xTranslate = -columnsInMaze/2
        self.yTranslate = rowsInMaze/2
        self.t = turtle.Turtle()
        self.t.shape('turtle')
        self.wn = turtle.Screen()
        self.wn.setworldcoordinates(-(columnsInMaze-1)/2-.5,-(rowsInMaze-1)/2-.5,(columnsInMaze-1)/2+.5,(rowsInMaze-1)/2+.5)

    def drawMaze(self):
        self.t.speed(10)
        for y in range(self.rowsInMaze):
            for x in range(self.columnsInMaze):
                if self.mazelist[y][x] == OBSTACLE:
                    self.drawCenteredBox(x+self.xTranslate,-y+self.yTranslate,'orange')
        self.t.color('black')
        self.t.fillcolor('blue')

    def drawCenteredBox(self,x,y,color):
        self.t.up()
        self.t.goto(x-.5,y-.5)
        self.t.color(color)
        self.t.fillcolor(color)
        self.t.setheading(90)
        self.t.down()
        self.t.begin_fill()
        for i in range(4):
            self.t.forward(1)
            self.t.right(90)
        self.t.end_fill()

    def moveTurtle(self,x,y):
        self.t.up()
        self.t.setheading(self.t.towards(x+self.xTranslate,-y+self.yTranslate))
        self.t.goto(x+self.xTranslate,-y+self.yTranslate)

    def dropBreadcrumb(self,color):
        self.t.dot(10,color)

    def updatePosition(self,row,col,val=None):
        if val:
            self.mazelist[row][col] = val
        self.moveTurtle(col,row)

        if val == PART_OF_PATH:
            color = 'green'
        elif val == OBSTACLE:
            color = 'red'
        elif val == TRIED:
            color = 'black'
        elif val == DEAD_END:
            color = 'red'
        else:
            color = None

        if color:
            self.dropBreadcrumb(color)

    def isExit(self,row,col):
        return (row == 0 or
                row == self.rowsInMaze-1 or
                col == 0 or
                col == self.columnsInMaze-1 )

    def __getitem__(self,idx):
        return self.mazelist[idx]


def searchFrom(maze, startRow, startColumn):
    # try each of four directions from this point until we find a way out.
    # base Case return values:
    #  1. We have run into an obstacle, return false
    maze.updatePosition(startRow, startColumn)
    if maze[startRow][startColumn] == OBSTACLE :
        return False
    #  2. We have found a square that has already been explored
    if maze[startRow][startColumn] == TRIED or maze[startRow][startColumn] == DEAD_END:
        return False
    # 3. We have found an outside edge not occupied by an obstacle
    if maze.isExit(startRow,startColumn):
        maze.updatePosition(startRow, startColumn, PART_OF_PATH)
        return True
    maze.updatePosition(startRow, startColumn, TRIED)
    # Otherwise, use logical short circuiting to try each direction
    # in turn (if needed)
    found = searchFrom(maze, startRow-1, startColumn) or \
            searchFrom(maze, startRow+1, startColumn) or \
            searchFrom(maze, startRow, startColumn-1) or \
            searchFrom(maze, startRow, startColumn+1)
    if found:
        maze.updatePosition(startRow, startColumn, PART_OF_PATH)
    else:
        maze.updatePosition(startRow, startColumn, DEAD_END)
    return found


myMaze = Maze('maze2.txt')
myMaze.drawMaze()
myMaze.updatePosition(myMaze.startRow,myMaze.startCol)

searchFrom(myMaze, myMaze.startRow, myMaze.startCol)

迷宫文件maze2.txt
数据结构与算法(Python版) | (8) 递归(上)

相关标签：数据结构与算法(Python版)

上一篇： jQuery事件整理

下一篇：我有一个二货女友

数据结构与算法(Python版) | (8) 递归(上)

1. 什么是递归

定义

初识递归:数列求和

递归程序如何被执行?

递归“三定律”

2. 递归的应用:任意进制转换

整数转换为任意进制

3. 递归调用的实现

递归调用实现

Python中的递归深度限制

递归的故事

4. 递归可视化:分形树

递归可视化:图示

一个递归作图的例子:螺旋

分形树:自相似递归图形

自然界不是平滑的

分形树:自相似递归图形

5. 递归可视化:谢尔宾斯基三角形

谢尔宾斯基Sierpinski三角形

谢尔宾斯基三角形:作图思路

6. 递归的应用:汉诺塔

复杂递归问题:汉诺塔

汉诺塔问题

汉诺塔问题:分解为递归形式

汉诺塔问题:分析

汉诺塔问题:递归思路

7. 递归的应用:探索迷宫

探索迷宫

迷宫的数据结构

探索迷宫:算法思路

探索迷宫:辅助的动画过程

Android scheme 跳转的设计与实现详解

Python 统计字数的思路详解

孙尚香与刘备的悲剧婚姻是谁导致的？

Vue.js每天必学之过渡与动画

Vue.js每天必学之组件与组件间的通信

Vue.js每天必学之过滤器与自定义过滤器

Vue.js每天必学之方法与事件处理器

Python解析并读取PDF文件内容的方法

零售版i9-9900KS泄露：风冷8核全开直上5.2GHz

太子与乞丐经典笑话一则