python基础(14):生成器、列表推导式
程序员文章站
2022-05-22 21:02:39
1. 生成器 什么是⽣成器?⽣成器实质就是迭代器。 在python中有三种⽅式来获取⽣成器: 1. 通过⽣成器函数 2. 通过各种推导式来实现⽣成器 3. 通过数据的转换也可以获取⽣成器 ⾸先,我们先看⼀个很简单的函数: def func(): print("111") return 222 ret ......
1. 生成器
什么是⽣成器?⽣成器实质就是迭代器。
在python中有三种⽅式来获取⽣成器:
1. 通过⽣成器函数2. 通过各种推导式来实现⽣成器3. 通过数据的转换也可以获取⽣成器
⾸先,我们先看⼀个很简单的函数:
def func(): print("111") return 222 ret = func() print(ret)
结果: 111 222
将函数中的return换成yield就是⽣成器
def func(): print("111") yield 222 ret = func() print(ret)
结果: <generator object func at 0x10567ff68>
运⾏的结果和上⾯不⼀样,为什么呢?由于函数中存在了yield,那么这个函数就是⼀个⽣成器
函数。这个时候,我们再执⾏这个函数的时候,就不再是函数的执⾏了,⽽是获取这个⽣成器。
如何使⽤呢? 想想迭代器,⽣成器的本质是迭代器,所以,我们可以直接执⾏__next__()来执⾏以下⽣成器。
def func(): print("111") yield 222 gener = func() # 这个时候函数不会执⾏. ⽽是获取到⽣成器 ret = gener.__next__() # 这个时候函数才会执⾏. yield的作⽤和return⼀样. 也是返回数据 print(ret)
结果: 111 222
那么我们可以看到,yield和return的效果是⼀样的,有什么区别呢? yield是分段来执⾏⼀个
函数,return呢? 直接停⽌执⾏函数。
def func(): print("111") yield 222 print("333") yield 444 gener = func() ret = gener.__next__() print(ret) ret2 = gener.__next__() print(ret2) ret3 = gener.__next__() # 最后⼀个yield执⾏完毕. 再次__next__()程序报错, 也就是说. 和return⽆关了. print(ret3)
结果: 111 traceback (most recent call last): 222 333 file "/users/sylar/pycharmprojects/oldboy/iterator.py", line 55, in <module> 444 ret3 = gener.__next__() # 最后⼀个yield执⾏完毕. 再次__next__()程序报错, 也就是说. 和return⽆关了. stopiteration
当程序运⾏完最后⼀个yield,那么后⾯继续进⾏__next__()程序会报错。好了⽣成器说完了,⽣成器有什么作⽤呢? 我们来看这样⼀个需求,老男孩向jack jones订
购10000套学⽣服,jack jones就比较实在,直接造出来10000套衣服。
def cloth(): lst = [] for i in range(0, 10000): lst.append("⾐服"+str(i)) return lst cl = cloth()
但是呢,问题来了。老男孩现在没有这么多学⽣啊,⼀次性给我这么多,我往哪⾥放啊. 很尴尬啊,最好的效果是什么样呢? 我要1套,你给我1套,⼀共10000套,是不是最完美的。
def cloth(): for i in range(0, 10000): yield "⾐服"+str(i) cl = cloth() print(cl.__next__()) print(cl.__next__()) print(cl.__next__()) print(cl.__next__())
区别: 第⼀种是直接⼀次性全部拿出来,会很占⽤内存,第⼆种使⽤⽣成器,⼀次就⼀个. ⽤多少⽣成多少。⽣成器是⼀个⼀个的指向下⼀个,不会回去,__next__()到哪,指针就指到哪⼉,下⼀次继续获取指针指向的值。
接下来我们来看send⽅法,send和__next__()⼀样都可以让⽣成器执⾏到下⼀个yield。
def eat(): print("我吃什么啊") a = yield "馒头" print("a=",a) b = yield "⼤饼" print("b=",b) c = yield "⾲菜盒⼦" print("c=",c) yield "game over"
gen = eat() # 获取⽣成器 ret1 = gen.__next__() print(ret1) ret2 = gen.send("胡辣汤") print(ret2) ret3 = gen.send("狗粮") print(ret3) ret4 = gen.send("猫粮") print(ret4)
send和__next__()区别:
1. send和next()都是让⽣成器向下走⼀次。
2. send可以给上⼀个yield的位置传递值,不能给最后⼀个yield发送值,在第⼀次执⾏⽣成器代码的时候不能使⽤send()。
⽣成器可以使⽤for循环来循环获取内部的元素:
def func(): print(111) yield 222 print(333) yield 444 print(555) yield 666
gen = func() for i in gen: print(i)
结果: 111 222 333 444 555 666
2. 列表推导式, ⽣成器表达式以及其他推导式
⾸先我们先看⼀下这样的代码,给出⼀个列表,通过循环,向列表中添加1-13 :
lst = [] for i in range(1, 15): lst.append(i) print(lst)
替换成列表推导式:
lst = [i for i in range(1, 15)] print(lst)
列表推导式是通过⼀⾏来构建你要的列表,列表推导式看起来代码简单,但是出现错误之后很难排查。
列表推导式的常⽤写法:
[ 结果 for 变量 in 可迭代对象]
例,从python1期到python14期写入列表lst:
lst = ['python%s' % i for i in range(1,15)] print(lst)
我们还可以对列表中的数据进⾏筛选
筛选模式:
[ 结果 for 变量 in 可迭代对象 if 条件 ]
# 获取1-100内所有的偶数 lst = [i for i in range(1, 100) if i % 2 == 0] print(lst)
⽣成器表达式和列表推导式的语法基本上是⼀样的,只是把[]替换成()
gen = (i for i in range(10)) print(gen)
结果: <generator object <genexpr> at 0x106768f10>
打印的结果就是⼀个⽣成器,我们可以使⽤for循环来循环这个⽣成器:
gen = ("麻花藤我第%s次爱你" % i for i in range(10)) for i in gen: print(i)
⽣成器表达式也可以进⾏筛选:# 获取1-100内能被3整除的数
gen = (i for i in range(1,100) if i % 3 == 0) for num in gen: print(num)
# 100以内能被3整除的数的平⽅ gen = (i * i for i in range(100) if i % 3 == 0) for num in gen: print(num)
# 寻找名字中带有两个e的⼈的名字 names = [['tom', 'billy', 'jefferson', 'andrew', 'wesley', 'steven','joe'], ['alice', 'jill', 'ana', 'wendy', 'jennifer', 'sherry', 'eva']]
# 不⽤推导式和表达式 result = [] for first in names: for name in first: if name.count("e") >= 2: result.append(name) print(result)
# 推导式 gen = (name for first in names for name in first if name.count("e") >= 2) for name in gen: print(name)
⽣成器表达式和列表推导式的区别:
1. 列表推导式比较耗内存,⼀次性加载,⽣成器表达式⼏乎不占⽤内存,使⽤的时候才分配和使⽤内存。2. 得到的值不⼀样,列表推导式得到的是⼀个列表,⽣成器表达式获取的是⼀个⽣成器。
举个栗⼦。
同样⼀篮⼦鸡蛋,列表推导式: 直接拿到⼀篮⼦鸡蛋。⽣成器表达式: 拿到⼀个老⺟鸡,需要鸡蛋就给你下鸡蛋。
⽣成器的惰性机制: ⽣成器只有在访问的时候才取值,说⽩了,你找他要他才给你值,不找他要,他是不会执⾏的。
def func(): print(111) yield 222
g = func() # ⽣成器g g1 = (i for i in g) # ⽣成器g1. 但是g1的数据来源于g g2 = (i for i in g1) # ⽣成器g2. 来源g1
print(list(g)) # 获取g中的数据. 这时func()才会被执⾏. 打印111.获取到222. g完毕. print(list(g1)) # 获取g1中的数据. g1的数据来源是g. 但是g已经取完了. g1 也就没有数据了 print(list(g2)) # 和g1同理
深坑==> ⽣成器,要值得时候才拿值。
字典推导式:
根据名字应该也能猜到,推到出来的是字典。
# 把字典中的key和value互换 dic = {'a': 1, 'b': '2'} new_dic = {dic[key]: key for key in dic} print(new_dic)
# 在以下list中. 从lst1中获取的数据和lst2中相对应的位置的数据组成⼀个新字典 lst1 = ['jay', 'jj', 'sylar'] lst2 = ['周杰伦', '林俊杰', '邱彦涛'] dic = {lst1[i]: lst2[i] for i in range(len(lst1))} print(dic)
集合推导式:
集合推导式可以帮我们直接⽣成⼀个集合。集合的特点: ⽆序,不重复,所以集合推导式⾃带去重功能。
lst = [1, -1, 8, -8, 12] # 绝对值去重 s = {abs(i) for i in lst} print(s)
总结: 推导式有,列表推导式,字典推导式,集合推导式,没有元组推导式。
⽣成器表达式:
(结果 for 变量 in 可迭代对象 if 条件筛选)
⽣成器表达式可以直接获取到⽣成器对象,⽣成器对象可以直接进⾏for循环,⽣成器具有
惰性机制。
下一篇: BFS&DFS广度优先搜索和深度优先搜索