pythonday12
一. 生成器
1. 生成器:生成器实质就是迭代器.
在python中有三种方式来获取生成器:
1. 通过生成器函数
2. 通过各种推导式来实现生成器
3. 通过数据的转换也可以获取生成器
我们先看一个很简单的函数:
def func(): print("111") return 222 ret = func() print(ret) 结果: 111 222
将函数中的return换成yield就是生成器
def func(): print("111") yield 222 ret = func() print(ret) 结果: <generator object func at 0x10567ff68>
2. 运行的结果和上面不一样. 为什么呢. 由于函数中存在了yield. 那么这个函数就是一个
生成器函数. 这个时候我们再执行这个函数的时候. 就不再是函数的执行了.而是获取
这个生成器.如何使用呢? 想想迭代器. 生成器的本质是迭代器. 所以我们可以直接执
行__next__()来执行以下生成器.
def func(): print("111") yield 222 gener = func() # 这个时候函数不会执行.而是获取到生成器 ret = gener.__next__() # 这个时候函数才会执行. yield的作用和return一样. 也是返回数据 print(ret) 结果: 111 222
那么我们可以看到, yield和return的效果是一样的. 有什么区别呢?
yield是分段来执行一个函数. return 直接停止执行函数.
def func(): print("111") yield 222 print("333") yield 444 gener = func() ret = gener.__next__() print(ret) ret2 = gener.__next__() print(ret2) ret3 = gener.__next__() # 最后一个yield执行完毕. 再次__next__()程序报错, 也就是说. 和return无关了. print(ret3) 结果: 111 Traceback (most recent call last): 222 333 File "/Users/sylar/PycharmProjects/oldboy/iterator.py", line 55, in <module> 444 ret3 = gener.__next__() # 最后一个yield执行完毕. __next__()程序报错, 也就是说. 和return无关了. StopIteration
注意:当程序运行完后一个yield. 那么后面继续进行__next__()程序会报错.
3. 生成器的作用:
我们来看这样一个需求. 老男孩向JACK JONES订 购10000套学生服. JACK JONES
就比较实在. 直接造出来10000套衣服.
def cloth(): lst = [] for i in range(0, 10000): lst.append("衣服"+str(i)) return lst cl = cloth()
问题来了,老男孩现在没有这么多学生, 一次性给这么多,我往哪里放啊. 好的效果是什么呢?
我要1套. 你给我1套.一共10000套.
def cloth(): for i in range(0, 10000): yield "衣服"+str(i) cl = cloth() print(cl.__next__()) print(cl.__next__()) print(cl.__next__()) print(cl.__next__())
区别: 第一种是直接一次性全部拿出来. 会很占用内存. 第二种使用生成器. 一次就一个. 用多
少生成多少.生成器是一个一个的指向下一个,不会回去, __next__()到哪, 指针就指到哪儿.
下一次继续获取指针指向的值.
4. 我们来看send方法, send和__next__()一样都可以让生成器执行到下一个yield.
def eat(): print("我吃什么啊") a = yield "馒头" print("a=",a) b = yield "大饼" print("b=",b) c = yield "韭菜盒子" print("c=",c) yield "GAME OVER" gen = eat() # 获取生成器 ret1 = gen.__next__() print(ret1) ret2 = gen.send("胡辣汤") print(ret2) ret3 = gen.send("狗粮") print(ret3) ret4 = gen.send("猫粮") print(ret4)
send和__next__()区别:
1. send和next()都是让生成器向下走一次
2. send可以给上一个yield的位置传递值,不能给后一个yield发送值. 在第一次执行生
成器代码的时候不能使用send()
5. 生成器可以使用for循环来循环获取内部的元素:
def func(): print(111) yield 222 print(333) yield 444 print(555) yield 666 gen = func() for i in gen: #for循环中,包含有向下执行的__next__函数 print(i) 结果: 111 222 333 444 555 666
二. 列表推导式, 生成器表达式以及其他推导式
1. 首先我们先看一下这样的代码, 给出一个列表, 通过循环, 向列表中添加1-14 :
lst = [] for i in range(1, 15): lst.append(i) print(lst) 替换成列列表推导式: lst = [i for i in range(1, 15)] print(lst)
列表推导式是通过一行来构建你要的列表, 列表推导式看起来代码简单.但是出现错误之后
很难排查.
2. 列表推导式的常用写法:
[ 结果 for 变量 in 可迭代对象]
例. 从python1期到python14期写入列表lst:
lst = ['python%s' % i for i in range(1,15)] print(lst)
3. 我们还可以对列表中的数据进行筛选
筛选模式:
[ 结果 for 变量 in 可迭代对象 if 条件 ]
# 获取1-100内所有的偶数 lst = [i for i in range(1, 100) if i % 2 == 0] print(lst)
4. 生成器表达式和列表推导式的语法基本上是一样的. 只是把[]替换成()
gen = (i for i in range(10)) print(gen) 结果: <generator object <genexpr> at 0x106768f10>
打印的结果就是一个生成器. 我们可以使用for循环来循环这个生成器:
gen = ("麻花藤我第%s次爱你" % i for i in range(10)) for i in gen: print(i)
5. 生成器表达式也可以进行筛选:
# 获取1-100内能被3整除的数 gen = (i for i in range(1,100) if i % 3 == 0) for num in gen: print(num) # 100以内能被3整除的数的平方 gen = (i * i for i in range(100) if i % 3 == 0) for num in gen: print(num) # 寻找名字中带有两个e的人的名字 names = [['Tom', 'Billy', 'Jefferson', 'Andrew', 'Wesley', 'Steven', 'Joe'], ['Alice', 'Jill', 'Ana', 'Wendy', 'Jennifer', 'Sherry', 'Eva']] # 不用推导式和表达式 result = [] for first in names: for name in first: if name.count("e") >= 2: result.append(name) print(result) # 推导式 gen = (name for first in names for name in first if name.count("e") >= 2) for name in gen: print(name)
6. 生成器表达式和列表推导式的区别:
1. 列表推导式比较耗内存.一次性加载.生成器表达式几乎不占用内存. 使用的时候才
分配和使用内存
2. 得到的值不一样. 列表推导式得到的是一个列表.生成器表达式获取的是一个生成器.
举个栗子.
同样一篮子鸡蛋. 列表推导式: 直接拿到一篮子鸡蛋.生成器表达式: 拿到一个老母鸡.需要
鸡蛋就给你下鸡蛋.
生成器的惰性机制:
生成器只有在访问的时候才取值.说白了.你找他要他才给你值.不找他要.他是不会执行的.
def func(): print(111) yield 222 g = func() # 生成器g g1 = (i for i in g) # 生成器g1. 但是g1的数据来源于g g2 = (i for i in g1) # 生成器g2. 来源g1 print(list(g)) # 获取g中的数据. 这时func()才会被执行. 打印111.获取到222. g完毕. print(list(g1)) # 获取g1中的数据. g1的数据来源是g. 但是g已经取完了. g1 也就没有数据了 print(list(g2)) # 和g1同理
注意:==> 生成器在要值得时候才拿值.
三,字典推导式:
根据名字应该也能猜到. 推到出来的是字典
# 把字典中的key和value互换 dic = {'a': 1, 'b': '2'} new_dic = {dic[key]: key for key in dic} print(new_dic) # 在以下list中. 从lst1中获取的数据和lst2中相对应的位置的数据组成一个新字典 lst1 = ['jay', 'jj', 'sylar'] lst2 = ['周杰伦', '林林俊杰', '邱彦涛'] dic = {lst1[i]: lst2[i] for i in range(len(lst1))} print(dic)
四,集合推导式:
集合推导式可以帮我们直接生成一个集合.
集合的特点: 无序, 不重复. 所以集合推导式自带去重功能.
lst = [1, -1, 8, -8, 12] # 绝对值去重 s = {abs(i) for i in lst} # bas()函数返回数据的绝对值 print(s) 结果 {8, 1, 12}
总结: 推导式有: 列表推导式, 字典推导式, 集合推导式, 没有元组推导式
生成器表达式: (结果 for 变量 in 可迭代对象 if 条件筛选)
生成器表达式可以直接获取到生成器对象.生成器对象可以直接进行for循环.
生成器具有惰性机制.
上一篇: 从浏览器渲染原理,浅谈回流重绘与性能优化
下一篇: Python中的集合
推荐阅读