news 2025/12/25 18:47:53

大模型从0到精通:误差反向传播——神经网络中的“责任追溯”系统

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型从0到精通:误差反向传播——神经网络中的“责任追溯”系统

本文是《大模型从0到精通》系列第一卷“奠基篇”的第五章,也是奠基篇的收官之作。前四章我们建立了完整框架:模型→损失→优化→网络结构。但神经网络有那么多参数,当预测出错时,怎么知道该调整哪个参数?本章将深入讲解反向传播——神经网络中的“责任追溯”系统,这是梯度下降能在深度网络中实现的关键算法。

一、深度网络的“责任分配”难题

我们的两层神经网络有10个参数:

  • 第一层:a₁,b₁, a₂,b₂, a₃,b₃
  • 第二层:c₁,c₂,c₃,d

当最终预测出错时(损失很大),我们面临核心难题:

该拧动第一层的哪个旋钮?还是第二层的哪个旋钮?每个旋钮该为错误负多少“责任”?

类比:公司业绩复盘

一家公司季度业绩不达标(损失很大):

  • CEO(输出层)决策错误
  • 但错误可能源于:A总监报告有误 → B经理数据有问题 → C员工收集错误
  • 需要一套系统,将总误差公平地“分摊”给每个责任人

这就是反向传播要解决的问题:将输出层的总误差,沿着网络连接反向追溯,精确计算每个参数的“责任梯度”。

二、前向传播复习:数据如何流动

网络结构回顾

输入 x → 第一层:h₁ = a₁x+b₁ → r₁ = ReLU(h₁) h₂ = a₂x+b₂ → r₂ = ReLU(h₂) h₃ = a₃x+b₃ → r₃ = ReLU(h₃) 第二层:y = c₁r₁ + c₂r₂ + c₃r₃ + d 输出 y

前向传播:执行计算

给定输入x=25(气温25℃):

  1. 第一层计算:
    h₁ = a₁×25 + b₁ → r₁ = ReLU(h₁) h₂ = a₂×25 + b₂ → r₂ = ReLU(h₂) h₃ = a₃×25 + b₃ → r₃ = ReLU(h₃)
  2. 第二层计算:
    y = c₁×r₁ + c₂×r₂ + c₃×r₃ + d
  3. 得到预测值y_pred

就像公司项目执行:数据从基层上报,经中层处理,CEO做出决策。

三、反向传播核心:链式法则

数学工具:链式求导

复合函数求导法则:

如果 z = f(y), y = g(x) 那么 dz/dx = dz/dy × dy/dx

直观理解:误差传播就像多米诺骨牌,每层都对最终误差有“贡献度”。

神经网络中的链式法则

我们的网络:损失L → 依赖于y → 依赖于c₁,c₂,c₃,d,r₁,r₂,r₃ → 依赖于a₁,b₁,a₂,b₂,a₃,b₃ → 依赖于x

要计算 ∂L/∂a₁(损失对参数a

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/22 22:46:08

同样是技术岗,35 岁后为何网络安全行业越老越吃香?

前几天我表弟小王来找我喝茶,聊着聊着突然问我:“老曹,你说我要不要转行做网络安全啊? 听说这行业挺赚钱的。 “我一听就笑了,这不正好最近我刚研究过这个行业吗? 我跟他说,别看现在各行各业…

作者头像 李华
网站建设 2025/12/17 22:28:31

[特殊字符] uni-app App 端实现文件上传功能(基于 xe-upload 插件)

在 uni-app 开发中,文件上传是一个常见且重要的功能。尤其是在 App 端,如何实现一个既美观又实用的文件上传与展示界面,是很多开发者关心的问题。本文将介绍如何通过 xe-upload 插件,结合自定义 UI,实现一个完整的文件…

作者头像 李华
网站建设 2025/12/17 22:27:35

二、Visual Studio 2026如何创建C语言项目

1.打开软件2.创建新项目3.下一步4.创建5.添加源文件(1)新建项(2)显示所有模板(3)添加C语言源文件后缀名为.c6.添加头文件(1)新建项(2)显示所有模板&#xff0…

作者头像 李华
网站建设 2025/12/17 22:27:26

Java二叉树:原理、实现与实战

深入浅出Java二叉树:原理、实现与实战 一、二叉树核心概念深度解析 1. 二叉树的定义与分类 二叉树是一种每个节点最多有2个子节点的树状结构,子节点分为左子节点(lChild)和右子节点(rChild)。根据节点分布规…

作者头像 李华
网站建设 2025/12/17 22:27:16

动态规划(四)算法设计与分析 国科大

0-1背包问题输入:给定物品集合 ,每个物品 i 对应重量 和价值;同时给定背包的总重量限制 W。输出:选择物品的一个子集,满足 “子集总重量不超过 W” 的约束,同时最大化子集的总价值。这是一个二元决策问题&a…

作者头像 李华
网站建设 2025/12/17 22:25:00

为什么90%的团队搞不定云原生Agent部署?Docker批量方案深度拆解

第一章:云原生Agent部署的现状与挑战随着云原生技术的快速发展,Agent作为实现可观测性、自动化运维和安全监控的核心组件,被广泛部署于Kubernetes集群、边缘节点及混合云环境中。这些轻量级代理程序负责采集指标、日志和追踪数据,…

作者头像 李华