news 2026/5/27 17:26:16

深度学习篇---瓶颈结构残差块

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
深度学习篇---瓶颈结构残差块

瓶颈结构残差块:深度学习中的“精兵简政”

让我用一个工厂生产线的比喻,让你秒懂这个精妙的设计。


核心比喻:高效的生产车间

想象一个处理特征的工厂

  • 输入特征图:一批等待加工的“原材料”。

  • 输出特征图:加工完成的“成品”。

  • 特征通道数:原材料的种类数量。比如256通道 = 有256种不同的原材料。


1. 普通残差块的问题

普通的残差块就像直接加工车间

原材料(256种) → [3×3卷积] → 中间品(256种) → [3×3卷积] → 成品(256种)

问题:两个3×3卷积都要处理256种原材料,计算量巨大

打个比方:有256种水果(苹果、香蕉、橙子...),你要做混合果汁。

  • 普通方法:把256种水果都先粗略混合 → 再精细混合 → 产出256种果汁。

  • 缺点:每次都处理256种,太麻烦了!


2. 瓶颈结构的智慧:三步精炼法

瓶颈结构是“压缩-加工-扩展”流水线

原材料(256种) → [1×1卷积] → 精华液(64种) → [3×3卷积] → 精华液(64种) → [1×1卷积] → 成品(256种) ⬇️ ⬇️ ⬇️ ⬇️ ⬇️ [压缩] [核心处理] [核心处理] [还原] [完成]

第一步:1×1卷积 → 数据“压缩专家”

  • 作用:把256种原材料压缩成64种精华液

  • 原理:1×1卷积就像是挑选和混合专家

    输入:256种水果 过程:专家精心挑选和混合,做成64种基础浓缩液 输出:64瓶高度浓缩的基础液
  • 为什么能压缩

    • 1×1卷积可以学习256→64的最佳线性组合

    • 它判断哪些特征可以合并,哪些不重要可以精简

    • 计算量大减:原本256×256→现在256×64

第二步:3×3卷积 → 核心“特征提取专家”

  • 作用:在浓缩的64种精华液上进行核心的空间特征提取

  • 好处

    之前:专家要在256种杂乱水果中寻找模式 ❌ 现在:专家只需专注处理64种精心准备的浓缩液 ✅
  • 效率提升:64种的处理成本远低于256种!

第三步:1×1卷积 → 数据“扩展专家”

  • 作用:把64种精华液扩展还原成256种成品

  • 原理:逆向的线性组合,加入新的特征维度:

    输入:64瓶浓缩液 过程:专家用这些浓缩液调制出256种不同风味的果汁 输出:256瓶成品果汁

3. 为什么叫“瓶颈”?

看这个形状:

256通道 64通道 64通道 256通道 输入 ────────→ [压缩] ─────→ [核心] ─────→ [扩展] ────────→ 输出 (宽入口) (窄瓶颈) (窄瓶颈) (宽出口)

数据流像通过一个沙漏

  • 入口宽(256)→ 瓶颈窄(64)→ 出口宽(256)

  • “瓶颈”就是那个最窄的64通道部分


4. 数字对比:省了多少计算?

假设输入是56×56像素的特征图:

普通块(两个3×3)计算量

第一个3×3卷积:56×56 × 256×256 × 3×3 ≈ 1.85亿次乘法 第二个3×3卷积:同样 ≈ 1.85亿次 总计:约3.7亿次乘法

瓶颈块(1×1→3×3→1×1)计算量

第一个1×1卷积:56×56 × 256×64 × 1×1 ≈ 0.51亿次 第二个3×3卷积:56×56 × 64×64 × 3×3 ≈ 0.12亿次 第三个1×1卷积:56×56 × 64×256 × 1×1 ≈ 0.51亿次 总计:约1.14亿次乘法

节省了约70%的计算量!这就是为什么ResNet-50(用瓶颈块)虽然比ResNet-34层数多,但计算量并没有按比例暴增。


5. 实际效果:不只是节省计算

方面普通块瓶颈块优势
计算量降低70%✅ 训练更快
参数数量减少✅ 更少内存,不易过拟合
特征提取直接但低效先精炼后处理✅ 质量更高
非线性能力两次ReLU三次ReLU✅ 表达能力更强

关键洞察:瓶颈块不是简单的计算节省,而是:

  1. 强迫网络学习更紧凑的特征表示(压缩时要做选择)

  2. 在低维空间进行核心计算,减少冗余

  3. 扩展时能融合新特征,丰富表达能力


生活中的类比

  1. 写论文

    • 普通:直接写3000字初稿 → 修改3000字 → 完成

    • 瓶颈:先写500字核心提纲 → 精修这500字 → 扩展成3000字论文 ✅

  2. 公司决策

    • 普通:所有256个员工都参与每个决策 → 混乱低效

    • 瓶颈:选出64人核心委员会做决策 → 高效决策 → 传达给全公司 ✅

  3. 厨房做菜

    • 普通:同时处理256种食材 → 容易手忙脚乱

    • 瓶颈:先准备64种基础酱料 → 用酱料烹饪 → 做成256道菜 ✅


总结:为什么瓶颈结构如此成功

核心理念:不要在“粗数据”上做“细活” 解决方案:压缩 → 精细处理 → 扩展 ⬇️ ⬇️ ⬇️ 过滤噪音 专注核心 丰富表达

这就是为什么从ResNet-50开始都用瓶颈块

  • ResNet-18/34:浅层网络,计算量不大,用普通块足够

  • ResNet-50+/101/152:深层网络必须高效,瓶颈块让“深度”变得可行且实用

这种“压缩-处理-扩展”的思想后来被广泛应用于:

  • MobileNet(深度可分离卷积)

  • EfficientNet(复合缩放)

  • Transformer(前馈网络也是类似结构)

一句话记住瓶颈结构“先浓缩精华,再精心加工,最后丰富呈现”——这是深度学习的效率与质量兼顾之道!

计算效率对比表

操作普通残差块瓶颈残差块节省比例
第一层卷积3×3卷积
256→256通道
1×1卷积
256→64通道
75%参数
第二层卷积3×3卷积
256→256通道
3×3卷积
64→64通道
94%参数
第三层卷积1×1卷积
64→256通道
-
总参数量约117万约69万节省41%
总计算量3.7亿次乘加1.14亿次乘加节省69%
内存占用较高较低更移动友好
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/23 14:19:40

不得了!天玑AIGEO优化系统口碑排行背后的营销奥秘

行业痛点分析在当前天玑AIGEO优化系统领域,存在着诸多技术挑战。对于拥有线下门店或区域化业务的企业而言,精准营销落地困难是一大难题。传统广告投放缺乏数据支撑,难以精准匹配目标客群,导致曝光量分散、转化率低迷,大…

作者头像 李华
网站建设 2026/5/22 10:52:13

Claude Code 完整学习计划

👋 欢迎! 你好!欢迎来到 Claude Code 学习之旅。这份学习计划专门为初学者设计,用最简单、最直白的方式帮你掌握这个强大的 AI 编程助手。 不用担心,我们会一步一步来,保证你能看懂、学会! &a…

作者头像 李华
网站建设 2026/5/17 5:43:01

AI 时代,我们是在进化还是在“脑力外包”?

当代码只剩“一句话”:AI 正在批量杀死程序员,还是在帮我们“脱壳”? 最近技术圈最焦虑的话题,莫过于 AI 程序员。 从 Cursor 的爆火到各种“一句话生成 App”的短视频刷屏,不少同行都在调侃:“以后不用写代码了,直接写小作文吧。”但玩笑归玩笑,深夜关掉编辑器,我们…

作者头像 李华
网站建设 2026/5/21 17:29:51

Spring Boot 2 + Flyway 最佳实践:多数据库配置与迁移规范

Spring Boot 2 Flyway 最佳实践:多数据库配置与规范化迁移适用技术栈:Spring Boot 2.x Flyway本文面向生产场景,提供一套可落地的 Flyway 最佳实践,涵盖多数据库配置方案、迁移脚本规范、环境隔离、回滚策略、团队协作与常见问题…

作者头像 李华
网站建设 2026/5/19 12:32:09

基于图像识别的智能垃圾分类系统设计与实现_jew30c27_xk054

一、项目技术介绍 开发语言:Java 框架:springboot JDK版本:JDK1.8 服务器:tomcat7 数据库:mysql 5.7(一定要5.7版本) 数据库工具:Navicat11 开发软件:eclipse/myeclipse/…

作者头像 李华