Python3 yield使用总结
示例
import scrapy class QuotesSpider(scrapy.Spider): name = "quotes def start_requests(self): urls = [ 'http://quotes.toscrape.com/page/1/', 'http://quotes.toscrape.com/page/2/', ] for url in urls: yield scrapy.Request(url=url, callback = self.parse)
在详细查询了文档说明后,得出以下结论:
一个带有 yield 的函数就是一个 generator,它和普通函数不同,生成一个 generator 看起来像函数调用,但不会执行任何函数代码,直到对其调用 next()(在 for 循环中会自动调用 next())才开始执行。虽然执行流程仍按函数的流程执行,但每执行到一个 yield 语句就会中断,并返回一个迭代值,下次执行时从 yield 的下一个语句继续执行。看起来就好像一个函数在正常执行的过程中被 yield 中断了数次,每次中断都会通过 yield 返回当前的迭代值。
yield 的好处是显而易见的,把一个函数改写为一个 generator 就获得了迭代能力,比起用类的实例保存状态来计算下一个 next() 的值,不仅代码简洁,而且执行流程异常清晰。
用下面的一段代码就非常好理解了。
def test2(n): print("hello") for i in range(n): yield i*i print("=====i*i=====",i*i) for i in test2(5): print("-----i-----",i) print("test")
返回结果:
hello -----i----- 0 test =====i*i===== 0 -----i----- 1 test =====i*i===== 1 -----i----- 4 test =====i*i===== 4 -----i----- 9 test =====i*i===== 9 -----i----- 16 test =====i*i===== 16
第二个用处,文件读取
def read_file(fpath): block_size = 1024 with open (fpath, 'rb') as f: block = f.read(block_size) if block: yield block else: return