news 2026/5/3 3:48:29

一文读懂Python的yield:初学者也能轻松掌握的生成器神器

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
一文读懂Python的yield:初学者也能轻松掌握的生成器神器

一文读懂Python的yield:初学者也能轻松掌握的生成器神器

文章目录

  • 一文读懂Python的yield:初学者也能轻松掌握的生成器神器
    • 生成器函数 VS 普通函数
      • 核心区别
    • yield的核心优势:惰性求值
    • yield的进阶小技巧
      • send():给生成器“传值”(双向通信)
      • yield from:简化嵌套生成器
    • yield常见应用场景

如果你刚学Python,可能对yield这个关键字有点陌生——它看起来像return,却又和return不一样。其实yield一点都不难,它的核心作用就一个:帮我们创建“生成器”,实现“用的时候再生成数据”,既省内存又灵活。不管是处理大文件,还是生成无限序列,yield都能派上大用场。今天我们就用最直白的话讲清yield,再配上简单代码练习,新手也能快速上手!

要搞懂yield,先对比我们最熟悉的return——毕竟它们都是“返回值”的工具,但用法和效果完全不同。下面我们先从基础例子入手,看看yield到底特殊在哪。

配合练习效果更佳哦!!

生成器函数 VS 普通函数

1、普通函数(用return):执行到return就结束,状态全销毁

# 普通函数,使用returndefnormal_func():print('执行第1步')return1print('执行第2步')# 调用执行result=normal_func()print(f'普通函数:{result}')

这段代码运行的结果会是什么呢?

结果如下

执行第1步 普通函数:1

2、生成器函数(用yield):遇到yield就暂停,保留状态

只要函数里有yield,它就不是普通函数了,而是“生成器函数”。调用它不会执行代码,只会得到一个“生成器对象”;只有用next()或for循环迭代时,才会执行代码

# 生成器函数,使用yielddefgen_func():print("执行第一步")yield1# 暂停执行,返回1,保留当前状态print("执行第二步")yield2# 再次暂停,返回2print("执行第三步")yield3# 最后一次暂停,返回3# 调用生成器函数,不会执行代码,只得到生成器对象gen=gen_func()print("直接调用的结果:",gen)# 用next()触发执行(每次next(),执行到下一个yield就停)print("\n第一次调用next(gen):")print(next(gen))print("\n第二次调用next(gen):")print(next(gen))print("\n第三次调用next(gen):")print(next(gen))# print(next(gen)) # 会抛出StopIteration异常!

对应结果如下:

如果第四次调用next(gen):生成器耗尽,会抛StopIteration异常

直接调用的结果:<generator object gen_func at 0x00000238C50BA3B0>第一次调用next(gen): 执行第一步1第二次调用next(gen): 执行第二步2第三次调用next(gen): 执行第三步3

3、用for循环迭代生成器

手动写next()太麻烦,for循环会自动处理StopIteration异常,迭代起来更简单,这也是实际开发中最常用的方式

defgen_func():print("执行第一步")yield1# 暂停执行,返回1,保留当前状态print("执行第二步")yield2# 再次暂停,返回2print("执行第三步")yield3# 最后一次暂停,返回3print("for循环迭代生成器:")fornumingen_func():print("获取到的值:",num)

可以得到结果如下:

for循环迭代生成器: 执行第一步 获取到的值:1执行第二步 获取到的值:2执行第三步 获取到的值:3

通过以上代码的练习,我们可以发现:

return是“一次性返回,直接结束”,yield是“分次返回,暂停保留状态”——这就是yield最核心的特点。

核心区别

特性return(普通函数)yield(生成器函数)
执行逻辑执行到 return 立即终止函数,销毁状态执行到 yield 暂停函数,保留当前状态
返回值直接返回最终值,函数调用即执行返回生成器对象,迭代时才逐步返回值
内存占用一次性生成所有数据,占用内存大按需生成数据,仅占用当前迭代的内存
可迭代性无(返回单个 / 多个值,需手动封装迭代)生成器对象本身是可迭代对象,支持 for/next

yield的核心优势:惰性求值

这个时候,问题很多的小明就要问了:“既然return也能返回值,我为啥还要用yield呀?”

答曰:yield能省内存!这种“用的时候再生成数据”的方式,叫“惰性求值”

为啥用yield就可以省内存呀?

假如说,现在我们需要100w条数据,用list存储,return返回,他会一次性把100w的数据全部放到内存中,这个时候,就有可能会导致电脑卡顿;但是如果使用yield,yield每次只会返回1个数据,用完就扔,可以说是几乎不占内存。

现在我们写一段代码来实验一下:

importtimeimportsysdefcreate_big_list():print("开始创建列表...")result=[iforiinrange(1000000)]print("列表创建完成")returnresultdefcreate_big_gen():print("创建生成器对象...")foriinrange(1000000):yieldiprint("生成器完成所有值的生成")# 对比创建时间print("=== 创建阶段 ===")start=time.time()list_big=create_big_list()print(f"创建列表耗时:{time.time()-start:.6f}秒")start=time.time()gen_big=create_big_gen()print(f"创建生成器耗时:{time.time()-start:.6f}秒")# 对比内存使用print(f"\n=== 内存使用 ===")print(f"列表大小:{sys.getsizeof(list_big):,}字节")print(f"生成器大小:{sys.getsizeof(gen_big):,}字节")# 验证惰性取值print("\n=== 惰性求值验证 ===")print("从生成器获取前5个值:")foriinrange(5):print(f" 第{i+1}个值:{next(gen_big)}")

结果如下:

===创建阶段===开始创建列表... 列表创建完成 创建列表耗时:0.043654秒 创建生成器耗时:0.000000===内存使用===列表大小:8,448,728 字节 生成器大小:104字节===惰性求值验证===从生成器获取前5个值: 创建生成器对象... 第1个值:0第2个值:1第3个值:2第4个值:3第5个值:4

可以看出yield消耗的内存可以说是远小于直接使用return返回的消耗的

另一个实用场景:逐行读取大文件。如果直接用read()读取几十GB的日志文件,会瞬间占满内存;用yield逐行读,就不会有这个问题

defread_big_file(file_path):# 打开文件(with语句会自动关闭文件,新手放心用)withopen(file_path,"r",encoding="utf-8")asf:forlineinf:yieldline.strip()

这里可以把内存看作家里的冰箱,而return与yield的区别就在于:

return会一次性买一周的量,可能会有冰箱装不下的风险,

而yield则是每次只买做一顿饭的量,吃多少买多少,所以冰箱不会有爆满的风险。

普通函数执行流程:
调用函数 → 执行代码 → 遇到return → 返回值 → 函数结束

生成器函数执行流程:
调用函数 → 返回生成器对象 → next()触发 → 执行到yield暂停 →
返回值 → 保留状态 → 下次next() → 从暂停处继续 → …

yield的进阶小技巧

send():给生成器“传值”(双向通信)

yield不仅能返回值,还能接收外部传进来的值,用send()方法就行。注意:第一次传值前,要先用next()触发生成器到暂停状态。

defchat_gen():print("生成器:你好!请给我发一条消息~")msg1=yield"等待你的消息..."# 暂停,返回提示语,同时接收外部传值print(f"生成器:收到你的消息啦:{msg1}")msg2=yieldf"已确认消息:{msg1}"# 再次暂停,接收第二条消息print(f"生成器:又收到一条消息:{msg2}")yieldf"结束对话,共收到两条消息"# 测试send()用法gen_chat=chat_gen()# 第一步:用next()触发生成器到第一个yieldfirst_reply=next(gen_chat)print("我收到的回复:",first_reply)# 第二步:用send()传值,同时触发生成器继续执行second_reply=gen_chat.send("Hello! yield真有趣~")print("我收到的回复:",second_reply)# 第三步:再传一条消息third_reply=gen_chat.send("我学会啦!")print("我收到的回复:",third_reply)

结果如下:

生成器:你好!请给我发一条消息~ 我收到的回复: 等待你的消息... 生成器:收到你的消息啦:Hello!yield真有趣~ 我收到的回复: 已确认消息:Hello!yield真有趣~ 生成器:又收到一条消息:我学会啦! 我收到的回复: 结束对话,共收到两条消息

yield from:简化嵌套生成器

如果有嵌套的生成器(生成器里套生成器),用yield from能直接迭代内部生成器的值,不用写复杂循环。

# 子生成器(内部的小生成器)defsub_gen():yield"苹果"yield"香蕉"# 主生成器(外部的生成器)defmain_gen():yield"开始输出水果:"yieldfromsub_gen()# 直接迭代sub_gen()的所有值,等价于for val in sub_gen(): yield valyield"结束输出水果"# 迭代主生成器forvalinmain_gen():print(val)

可以得到如下结果:

开始输出水果: 苹果 香蕉 结束输出水果

yield常见应用场景

常见的应用场景如下:

  • 处理大文件/大数据:比如逐行读日志、生成百万级数据(省内存);
  • 生成无限序列:比如生成自然数、斐波那契数列(列表存不下,生成器能一直给值);
  • 分步执行任务:比如爬虫的“请求网页→解析数据→保存数据”,每一步用yield暂停,方便调试;
  • 简单协程/异步:入门级的异步操作(比如简单的任务调度),yield是基础。

最后再实现一个用yield生成无限斐波那契数列的代码:

斐波那契数列:在一组数据中,每个数都等于前两个数之和

deffib_gen():a,b=0,1whileTrue:# 无限循环,生成器不会一次性执行完yielda# 每次返回一个斐波那契数a,b=b,a+b# 更新值# 取前10个斐波那契数(避免无限迭代)fib=fib_gen()print("前10个斐波那契数:")for_inrange(10):print(next(fib),end=" ")

总结:新手掌握yield的核心要点

其实yield一点都不复杂,新手记住3个核心点就行:

  1. 有yield的函数是生成器函数,调用不执行,返回生成器对象;
  2. 用next()或for循环触发执行,遇到yield就暂停、返回值、保留状态;
  3. 核心优势是惰性求值,省内存,适合大数据/大文件场景。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/30 23:40:06

笔记本电脑怎么买便宜:避开陷阱,直达最优价

看着电商平台上琳琅满目的笔记本电脑&#xff0c;价格从三千到三万不等&#xff0c;刚需的消费者往往陷入选择困难&#xff0c;既担心买贵了&#xff0c;又怕买错了。近年来&#xff0c;不同品牌和型号的笔记本电脑价格差异显著&#xff0c;即使是同一款产品&#xff0c;在不同…

作者头像 李华
网站建设 2026/4/30 23:40:11

SPSS——非参数检验-“二项式检验”

更多免费教程和软件 :​ 非参数检验 假设检验的方法包括参数检验和非参数检验。 参数检验 凡是以特定的总体分布为前提,对未知的总体参数做推断的假设检验方法统称为参数检验。如T检验 非参数检验 非参数检验适用的范围很广,对资料没有要求,对总体分布几乎没有什么假定,…

作者头像 李华
网站建设 2026/4/30 23:40:12

Apache Iceberg性能大揭秘:如何让你的大数据查询快如闪电?

还在为海量数据分析的查询延迟而烦恼吗&#xff1f;当你的数据仓库查询时间从秒级飙升到分钟级&#xff0c;当小文件数量爆炸式增长导致存储系统不堪重负&#xff0c;是时候认识一下Apache Iceberg这个数据湖表的革命性技术了&#xff01; 【免费下载链接】iceberg Apache Iceb…

作者头像 李华
网站建设 2026/4/30 23:06:07

19、Linux内核模块与设备驱动详解

Linux内核模块与设备驱动详解 1. 内核模块基础 1.1 模块加载与符号解析 内核模块加载时不需要 .ko 扩展名,加载后仅通过基名识别。模块通常会包含对外部符号(如 printk )的引用, insmod 会根据内核符号表解析这些外部引用,该符号表在核启动过程中加载到内存。模块…

作者头像 李华
网站建设 2026/5/1 0:20:32

如何快速掌握沉浸式翻译?5个终极技巧让阅读效率提升300%

如何快速掌握沉浸式翻译&#xff1f;5个终极技巧让阅读效率提升300% 【免费下载链接】immersive-translate 沉浸式双语网页翻译扩展 , 支持输入框翻译&#xff0c; 鼠标悬停翻译&#xff0c; PDF, Epub, 字幕文件, TXT 文件翻译 - Immersive Dual Web Page Translation Extensi…

作者头像 李华
网站建设 2026/5/2 19:25:12

69、Subversion与GNU make实用指南

Subversion与GNU make实用指南 1. Subversion管理工具概述 Subversion是一款强大的版本控制系统,拥有多种管理工具,用于不同方面的操作,如仓库管理、信息查看、远程访问等。下面将详细介绍这些工具及其用法。 2. 仓库管理工具svnadmin svnadmin是用于监控和修复Subversi…

作者头像 李华