news 2026/7/2 15:30:08

学习 深度学习7-VGGNet总结

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
学习 深度学习7-VGGNet总结

VGGNet是由牛津大学视觉几何组(Visual Geometry Group)于2014年提出的经典卷积神经网络模型。相较于此前占据主导地位的AlexNet,VGGNet通过统一使用小尺寸卷积核模块化的堆叠思想,显著加深了网络结构,参数总计约1.38亿

一、 模型整体架构

VGGNet共包含六种不同的网络架构(A至E),分别对应不同的深度。所有模型均由六个大的特征块(Block)组成,块与块之间通过最大池化层(MaxPooling)进行空间维度的下采样。

VGGNet摒弃了AlexNet中使用的11x115x5大卷积核,全面采用3x3的卷积核。大幅减少了网络参数并在每层之间插入了额外的ReLU非线性激活函数,使得模型决策函数具有更强的判别能力。

二、 VGG-16(D类)网络结构讲解

D类架构是VGGNet中最经典、应用最广泛的变体,其名称中的“16”代表该网络包含16个具有可训练权重的层(13个卷积层 + 3个全连接层)。模型输入图像尺寸固定为224 x 224 x 3(RGB三通道)。

块1

结构序列:卷积 -> ReLU -> 卷积 -> ReLU -> 最大池化

卷积层:包含2个卷积层,每层采用64个尺寸为3x3x3的卷积核。步幅(Stride)设为1,填充(Padding)设为1(保持尺寸不变)。输出特征图尺寸为 224x224x64。

激活函数:每层卷积后接入ReLU函数。

池化层:采用 2x2 的窗口,步幅设为2,填充为0。此操作将特征图空间尺寸减半,输出尺寸为112x112x64

块2:

结构序列:卷积 -> ReLU -> 卷积 -> ReLU -> 最大池化

卷积层:包含2个卷积层,每层卷积核数量扩充至128个,尺寸仍为3x3。保持步幅1和填充1,输出尺寸为 112x112x128。

池化层:参数同块1(2x2,步幅2),输出尺寸为56x56x128

块3:

结构序列:卷积 -> ReLU -> 卷积 -> ReLU -> 卷积 -> ReLU -> 最大池化

卷积层:包含3个卷积层,每层卷积核数量增加至256个,尺寸3x3,步幅1,填充1。输出尺寸为 56x56x256。

池化层:2x2窗口,步幅2,输出尺寸为28x28x256

块4:

结构序列:卷积 -> ReLU -> 卷积 -> ReLU -> 卷积 -> ReLU -> 最大池化

卷积层:包含3个卷积层,卷积核数量提升至512个,尺寸3x3。步幅1,填充1,输出尺寸为 28x28x512。

池化层:2x2窗口,步幅2,输出尺寸14x14x512

块5:

结构序列:卷积 -> ReLU -> 卷积 -> ReLU -> 卷积 -> ReLU -> 最大池化

卷积层:包含3个卷积层,每层保持512个3x3卷积核。步幅1,填充1,输出尺寸为 14x14x512。

池化层:2x2窗口,步幅2,输出尺寸为7x7x512

块6:(全连接层)

结构序列:全连接 -> ReLU -> Dropout -> 全连接 -> ReLU -> Dropout -> 全连接 -> Softmax

第一层:展平特征图接入4096个神经元的全连接层,后接ReLU激活函数及Dropout(丢弃率0.5)以防止过拟合。

第二层:同样为4096个神经元,后接ReLU与Dropout。

第三层(输出层):包含1000个神经元,对应ImageNet数据集的1000个类别,接入Softmax函数输出最终分类概率。

VGGNet证明了增加网络深度可以有效提升模型性能

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/2 15:27:24

大模型MoE架构揭秘:为何仅2%参数参与推理

1. 这不是“参数越多越强”的简单故事:拆解大模型里被悄悄激活的那2%你可能已经看过不少标题党文章,说“GPT-4有1.8万亿参数”,然后配上一张CPU满载、风扇狂转的动图,仿佛这串数字本身就在燃烧算力。但真实情况恰恰相反——它只用…

作者头像 李华
网站建设 2026/7/2 15:26:12

3步掌握Chrome画中画扩展:释放多任务处理潜能

3步掌握Chrome画中画扩展:释放多任务处理潜能 【免费下载链接】picture-in-picture-chrome-extension 项目地址: https://gitcode.com/gh_mirrors/pi/picture-in-picture-chrome-extension 在当今信息爆炸的时代,我们经常需要在观看视频的同时处…

作者头像 李华
网站建设 2026/7/2 15:26:08

生产级机器学习模型部署:从Notebook到Kubernetes的工程化实践

1. 项目概述:这不是“跑通模型”,而是让模型在真实世界里活下来 “From Notebook to Production: Running ML in the Real World (Part 4)”——这个标题本身就像一句行话暗号,老手一眼就懂:前面三篇已经蹚过了数据清洗、特征工程…

作者头像 李华
网站建设 2026/7/2 15:25:00

LP5812 RGB LED驱动与PIC18F2585微控制器的智能灯光系统设计

1. 项目背景与核心价值 在智能硬件和交互式设备设计中,灯光效果已经成为提升用户体验的关键要素之一。一个精心设计的灯光系统不仅能够提供状态指示功能,更能通过动态效果创造情感连接。这正是LP5812 RGB LED驱动芯片与PIC18F2585微控制器组合的独特优势…

作者头像 李华
网站建设 2026/7/2 15:24:03

Windows资源管理器美化终极指南:如何快速实现Mica毛玻璃效果

Windows资源管理器美化终极指南:如何快速实现Mica毛玻璃效果 【免费下载链接】ExplorerBlurMica Add background Blur effect or Acrylic (Mica for win11) effect to explorer for win10 and win11 项目地址: https://gitcode.com/gh_mirrors/ex/ExplorerBlurMic…

作者头像 李华
网站建设 2026/7/2 15:23:44

B站会员购抢票终极指南:5分钟配置,轻松抢到漫展门票!

B站会员购抢票终极指南:5分钟配置,轻松抢到漫展门票! 【免费下载链接】biliTickerBuy b站会员购购票辅助工具 项目地址: https://gitcode.com/GitHub_Trending/bi/biliTickerBuy 还在为抢不到B站会员购的漫展门票而烦恼吗?…

作者头像 李华