神秘而强大的Python生成器精讲

一、 生成器(generator)概念

生成器是一个特殊的迭代器,它保存的是算法,每次调用next()或send()就计算出下一个元素的值,直到计算出最后一个元素,没有更多的元素时,抛出StopIteration。生成器有两种类型,一种是生成器表达式(又称为生成器推导),一种是生成器函数。

二、 生成器表达式

生成器表达式是通过一个Python表达式语句去计算一系列数据,但生成器定义的时候数据并没有生成,而是返回一个对象,这个对象只有在需要的时候才根据表达式计算当前需要返回的数据:

生成器表达式来源于迭代和列表解析(列表解析后面章节介绍)的组合,生成器和列表解析类似,但是它使用小括号而不是中括号。生成器返回按需产生结果的一个对象,而不是一次构建一个结果列表;

生成器表达式的语法如下:

(exprforiter_variniterable)
(exprforiter_variniterableifcond_expr)

其中:

expr为计算 生成器元素值的表达式

for iter_var in iterable iter_var:表示针对在可迭代对象iter_var中的每个元素进行表达式运算

if cond_exp:表示可迭代对象中的元素需要满足指定条件才会参与表达式运算

说明

直接在一对既有的小括号内(如在函数调用中)使用生成器表达式时,无需再添加一对小括号。例如:sum(i ** 2 for i in range(10));

生成器表达式与列表解析的语法非常象,由于涉及部分相关的函数,在列表解析相关的章节老猿再回头介绍一下生成器表达式有关的内容。

三、 生成器函数

生成器函数是一种语句中包含yield关键词的特殊的函数,它本身是一个迭代器,外部需要访问该迭代器数据的代码通过调用next函数(或迭代器的__next__方法)或send方法,触发函数执行计算并通过yield返回一个计算结果数据,返回数据后该函数立即停止执行,函数状态会保存在本地变量中,直到外部下次调用再激活,从上次停止执行部分开始执行。

1、 关于生成器函数与调用方的执行过程解析

生成器函数定义示意代码(非可执行代码)如下:

deffun():

初始化

循环:

计算得到k

nRet=yieldk

其他循环代码

上面代码示意表示:生成器函数运行时计算得到结果k通过yield返回数据k给调用方,返回k给调用方之后,生成器函数停止执行,yield的调用执行结果并没有返回给生成器函数, nRet的赋值也并没有执行,等待下次调用后,再返回yield本身的执行结果,并继续后续循环代码,直到再次执行yield。

老猿通过验证理解有几个细节在此说明一下:

a) yield函数的执行是一条语句,但实际执行时该语句被分解成两部分,第一部分是将计算结果k返回给send或next调用处(下称触发方),保存当前环境,暂停执行,另一部分就是恢复当前环境,返回yield本身的执行结果给生成器函数的调用处,并继续往下执行后续循环。每次调用yield时,除了第一次是从第一部分执行,后续都是从第二部分开始执行。

b) yield返回值(nRet记下来的值)在触发方为next(含__next__方法,下同)时,为None,如果触发方是send,则该值为send方法参数中的发送值;

c) 生成器函数在调用时只是生成一个生成器实例,并没有真正执行,真正执行只有第一次通过next触发时才会进入函数执行,注意第一次触发不能是send方式触发。

2) 调用生成器代码示意

defmain():

初始化

f=fun()
next(f)

循环:

其他循环代码

nRet=send(x)

其他循环代码

上面代码示意表示:调用方执行自身初始化,然后进行生成器函数的初始化,然后执行循环迭代访问生成器函数的数据。

同样有几个细节老猿在此说明一下:

a) f= fun(),这个语句不会进入函数执行,只是生成一个生成器实例f

b) 第一个next调用只有循环代码中使用send触发时才需要,如果循环中用next则无需先执行一次send;

c) 第一个next执行时会触发调用生成器函数,从生成器第一行代码开始执行;后续的next或send执行,不再执行生成器函数的初始化部分,只是从yield的第二部分开始执行,第二部分执行时应该在生成器函数的循环迭代代码内,因此此后执行还是在生成器函数的循环代码内循环,直到遇到yield语句,执行完yield语句的第一部分逻辑挂起函数等待再次出发;

d) nRet记录的返回值就是生成器函数yield后面返回给触发方的数据。

2、 下面是一个老猿编写的模拟存快递包裹的生成器函数及其调用代码,每执行一次存包裹的函数就挂起,主程序等待确认是否继续循环,如果不继续则退出,代码如下:

importrandom
defPutPackage():
print(‘PutPackagestart…’)
nRet=123
whileTrue:
ifnRet<1:break
print(‘PutPackage:BeforeYield…’)
nRet=yield’PutPackage’+str(nRet)#返回字符串PutPackage+上次循环yield的返回值
print(‘PutPackage:AfterYield,nRet=’,nRet)
ifnotnRet:continue
defmainf():
print(‘mainfstartcallPutPackage…’)
vPutPackage=PutPackage()#只是返回生成器generator对象
bBreak=False
print(‘mainfstartcallnext…’)
nRet=next(vPutPackage)#生成器初始化
print(‘mainfendcallnext,nRet=’,nRet)
whileTrue:
ifbBreak:
try:#为什么要捕获异常?
vPutPackage.send(-1)#触发—1给生成器函数提示函数退出
exceptStopIteration:pass
break
print(‘mainfloopstartcallsend…’)
nRet=vPutPackage.send(random.randint(10000,99999))#产生一个随机包裹编号触发给生成器函数
print(‘mainfloopaftercallsend,nRet=’,nRet)
sConfirm=input(“是否准备结束存件取件循环(Y或y是,否则继续循环):”)
ifsConfirm.strip().upper()==‘Y’:
bBreak=True
print("\n")
mainf()

执行结果如下,大家对照前面的执行过程解析理解一下:

mainfstartcallPutPackage…
mainfstartcallnext…
PutPackagestart…
PutPackage:BeforeYield…
mainfendcallnext,nRet=PutPackage123
mainfloopstartcallsend…
PutPackage:AfterYield,nRet=66468
PutPackage:BeforeYield…
mainfloopaftercallsend,nRet=PutPackage66468

是否准备结束存件取件循环(Y或y是,否则继续循环):n

mainfloopstartcallsend…
PutPackage:AfterYield,nRet=22204
PutPackage:BeforeYield…
mainfloopaftercallsend,nRet=PutPackage22204

是否准备结束存件取件循环(Y或y是,否则继续循环):y

PutPackage:AfterYield,nRet=-1

上述代码中为什么要捕获异常?这是因为最后一个send(-1)时,是从yield第二部分执行,执行到循环“if nRet<1 : break”语句就会终止循环,不会再通过yield向触发方返回值,此时send执行就会出现迭代结束的异常。

3、 生成器函数的其他说明

Python使用生成器对延迟操作提供了支持。所谓延迟操作,是指在需要的时候才产生结果,而不是立即产生结果。这有利于节省内存,特别是生成器进行科学计算时很有用;

生成器就是迭代器,除了next方法外,也可以通过for循环来遍历出生成器中的内容;

生成器除了前面介绍的__next__、send方法外,还有throw、close方法:

a) throw(type[, value[, traceback]]):该方法在生成器暂停的位置引发 type 类型的异常,并返回该生成器函数所产生的下一个值。 如果生成器没有产生下一个值就退出,则将引发 StopIteration 异常。 如果生成器函数没有捕获传入的异常,或引发了另一个异常,则该异常会被传播给调用者。该方法可以解决上面案例捕获异常的处理

发表回复