news 2026/3/20 3:37:29

深度学习权重计算三步法则

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
深度学习权重计算三步法则

先把“游戏规则”全部定死(非常重要)

1️⃣ 模型

y = wx +b

2️⃣ 数据(只用 1 个点)

x = 2 y_true = 4

3️⃣ 初始参数

w = 1 b = 0

4️⃣ Loss(平方误差)

5️⃣ 学习率

lr = 0.1

二、前向传播(算预测)

1️⃣ 算预测值

y_hat = w x + b = 1 * 2 + 0 = 2

2️⃣ 算 loss

L = 1/2 * (2 - 4)^2 = 1/2 * 4 = 2

三、反向传播:算梯度(最关键)

我们现在问一个问题:

如果我把 w 稍微变大一点点,loss 是变大还是变小?


1️⃣ 写出 loss 关于 w 的公式


2️⃣ 对 w 求导(一步一步)


3️⃣ 代入当前数值

(w x - y) = (1 * 2 - 4) = -2 x = 2

所以代入公式2:

grad = -2 * 2 = -4

🔥 解释这个「-4」是什么意思

  • 梯度是负的

  • 意味着:

👉增大 w,会让 loss 下降


四、SGD 更新(你问的核心)

更新公式

w_new = w - lr * grad

代入数值

w_new = 1 - 0.1 * (-4) = 1 + 0.4 = 1.4

五、更新之后,loss 真的变小了吗?(验证)

新预测

y_hat = 1.4 * 2 = 2.8

新 loss

L = 1/2 * (2.8 - 4)^2 = 1/2 * 1.44 = 0.72

2 → 0.72,loss 真的下降了


六、再走一步

第二步更新

当前参数

w = 1.4

算梯度

(w x - y) = (1.4 * 2 - 4) = -1.2 grad = (w x - y) *x = -1.2 * 2 = -2.4

更新

w_new = 1.4 - 0.1 * (-2.4) = 1.64

loss

L = 1/2 * (1.64 * 2 - 4)^2 = 0.13

七、现在应该能“看见”梯度下降在干嘛了

  • 梯度的符号:告诉你往哪边走

  • 梯度的大小:告诉你走多远

  • 学习率:控制步子大小

八、权重更新三步走:

# 1. 计算损失 - 前向传播
loss = criterion(model(inputs), labels) # 计算预测值与真实值的差异

# 2. 计算梯度 - 反向传播
loss.backward() # 自动计算所有参数的梯度并存储

# 3. 更新权重 - 优化器步进
optimizer.step() # 根据梯度更新模型参数

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/17 15:04:31

Portainer实战:5步构建零基础CI/CD自动化部署流水线

Portainer实战:5步构建零基础CI/CD自动化部署流水线 【免费下载链接】portainer Portainer: 是一个开源的轻量级容器管理 UI,用于管理 Docker 和 Kubernetes 集群。它可以帮助用户轻松地部署、管理和监控容器,适合用于运维和开发团队。特点包…

作者头像 李华
网站建设 2026/3/15 15:57:52

Apertus多语言大模型:终极开源解决方案助力全球语言无障碍交流

在当今人工智能技术飞速发展的时代,Apertus多语言大模型以其1811种语言的原生支持能力和完全透明的开源架构,正在重新定义全球化AI应用的边界。这款由瑞士国家人工智能研究所开发的700亿参数模型,不仅实现了与闭源模型媲美的性能表现&#xf…

作者头像 李华
网站建设 2026/3/19 14:48:29

GKD自动化终极指南:告别重复点击,让手机更智能 [特殊字符]

GKD自动化终极指南:告别重复点击,让手机更智能 📱 【免费下载链接】gkd gkd-kit/gkd: 这个项目可能不存在或者已迁移,无法提供详细信息。 项目地址: https://gitcode.com/gh_mirrors/gk/gkd 你是否厌倦了每天在手机上重复点…

作者头像 李华
网站建设 2026/3/15 15:40:30

交换机.路由器.防火墙-技术提升【7.7】

5. 配置 Identity NAT 使用网络对象配置 Identity NAT 的操作过程如下。 ① (可选)为映射地址(与真实地址相同)配置网络对象。如果在 nat 命令中指定了 IP 地址作为内联,也可以跳过该步骤。 hostname(config)#object network obj_name hostname(config-network-object)#{h…

作者头像 李华
网站建设 2026/3/15 15:40:29

2025年必看!热门目管理软件排行榜,高效办公就靠它

精选10款好用的项目管理软件,从核心定位、功能细节到适用场景进行深度解析:进度猫 核心定位:国内轻量级可视化项目管理标杆,以“简单好用的甘特图”为核心卖点,聚焦进度管控核心需求。 核心功能:支持任务无…

作者头像 李华