news 2026/5/9 6:32:32

全连接层(Fully Connected Layer)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
全连接层(Fully Connected Layer)

全连接层(Fully Connected Layer,又称稠密层/Dense Layer)是神经网络中最基础且重要的组件之一,广泛应用于多层感知机(MLP)、卷积神经网络(CNN)和Transformer等架构中。以下是对全连接层的系统分析:
. 核心定义
结构特点:层中每个神经元与上一层的所有神经元相连,每个连接都有独立的权重参数。

数学表达:


2. 核心功能与原理
(1)特征空间变换
通过矩阵乘法将输入映射到新的特征空间,实现特征的组合与抽象。

示例:在图像分类中,CNN 末端的全连接层将卷积提取的局部特征整合为全局语义信息。

(2)非线性拟合能力
结合激活函数(如 ReLU)引入非线性,使网络能够逼近复杂函数(通用近似定理)。

(3)参数量与计算量
参数量:m×n+m(权重 + 偏置)

计算量:矩阵乘法复杂度 O(m×n),易成为计算瓶颈。

  1. 在全连接神经网络(MLP)中的角色
    通常多个全连接层堆叠,层间通过激活函数连接。

层级特征提取:浅层学习低级特征(如边缘),深层组合为高级抽象特征。

  1. 在CNN中的应用
    末端分类器:将卷积层输出的二维特征图展平为一维向量,通过全连接层映射到类别空间。
    1.基本使用
importtorchimporttorch.nnasnnimporttorch.nn.functionalasF# 1. 基本创建方式fc_layer=nn.Linear(in_features=784,out_features=256,bias=True)print(f"权重形状:{fc_layer.weight.shape}")# torch.Size([256, 784])print(f"偏置形状:{fc_layer.bias.shape}")# torch.Size([256])# 2. 前向传播示例batch_size=32input_tensor=torch.randn(batch_size,784)# [batch, features]output=fc_layer(input_tensor)# [batch, 256]print(f"输出形状:{output.shape}")

2 关键参数详解

classLinear(nn.Module):""" 参数说明: ---------- in_features : int 输入特征维度 out_features : int 输出特征维度 bias : bool, default=True 是否使用偏置项 device : torch.device, optional 计算设备 dtype : torch.dtype, optional 权重数据类型 """def__init__(self,in_features,out_features,bias=True):super().__init__()self.in_features=in_features self.out_features=out_features self.weight=nn.Parameter(torch.Tensor(out_features,in_features))ifbias:self.bias=nn.Parameter(torch.Tensor(out_features))else:self.register_parameter('bias',None)self.reset_parameters()
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/8 0:57:19

一文讲透布隆过滤器实现原理及应用场景总结

布隆过滤器的工作原理布隆过滤器的工作原理基于三个核心要素:1. 一个大的位数组(Bit Array)这是布隆过滤器的存储主体。它是一个长度为 m 的数组,每个位置只存储一个比特(0或1)。初始时,所有位都…

作者头像 李华
网站建设 2026/5/1 0:07:54

理性抉择方可行远——企业AI转型的路径选择与风险管控

数字化浪潮下,AI转型已成为企业提升核心竞争力的必答题。然而现实中,不少企业陷入“转型即烧钱”“技术即万能”的误区:传统制造企业盲目自研大模型,耗费数百万后无功而返;互联网公司一味追求API集成便捷性&#xff0c…

作者头像 李华
网站建设 2026/4/30 22:47:46

C51_74HC595串口转并口

文章目录一、74HC595   1、芯片引脚   2、内部框图   3、时序操作二、单芯片工模式   1、原理图   2、驱动代码     1)、74hc595.h     2)、74hc595.c     3)、mian.c三、级联工作模式   1、原理图   2、驱动代码 …

作者头像 李华
网站建设 2026/5/8 7:50:10

C51_HC-SR04超声波模块

文章目录一、HC-SR04   1、电气参数   2、引脚二、HC-SR04工作原理   1、基本工作原理   2、超声波时序图   3、原理图三、代码实例   1、UT.h   2、UT.c   3、main.c   4、实例现象一、HC-SR04 HC-SR04 超声波测距模块可提供 2cm-400cm 的非接触式距离感测功…

作者头像 李华
网站建设 2026/4/30 22:47:26

C51_AH3144霍尔传感器

文章目录一、霍尔传感器   1、霍尔传感器分类   2、AH3144:二、代码实例   1、查询方式(物体计数)   2、外部中 断方式(电机测速)   3、实例现象一、霍尔传感器 霍尔传感器是一种基于霍尔效应的磁敏传感器&a…

作者头像 李华
网站建设 2026/5/8 0:34:46

进程内存统计

参考链接 https://help.aliyun.com/zh/arms/application-monitoring/developer-reference/memory-metrics

作者头像 李华