news 2026/4/19 4:29:47

别再死记硬背链式法则了!用一张图+三个例子彻底搞懂多元复合函数求导

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
别再死记硬背链式法则了!用一张图+三个例子彻底搞懂多元复合函数求导

多元复合函数求导:用计算图破解链式法则的思维困局

第一次看到多元复合函数的链式法则时,大多数人的反应都是"这公式怎么长得像化学方程式"。当教科书上突然抛出$\frac{\partial z}{\partial s}=\frac{\partial z}{\partial x}\frac{\partial x}{\partial s}+\frac{\partial z}{\partial y}\frac{\partial y}{\partial s}$这样的表达式时,那些下标和分数线的组合简直就像天书。但当我发现可以用一张图解决所有问题时,整个多元微积分突然变得清晰起来——这就是计算图的魔力。

1. 为什么传统记忆方法总是失效

在物理系大三那年,我目睹了同学在热力学考试中把$\frac{\partial T}{\partial P}$写成$\frac{\partial P}{\partial T}$的惨剧。这种错误不是粗心,而是对链式法则本质理解缺失的必然结果。传统教学常犯三个致命错误:

  • 符号滥用:用相同的$\frac{\partial z}{\partial x}$表示不同上下文中的偏导数,实际上在复合函数$z=f(x(u,v),y(u,v))$中,$\frac{\partial z}{\partial x}$与$\frac{\partial x}{\partial u}$有着本质区别
  • 路径缺失:没有可视化变量间的依赖关系,导致求导时遗漏路径
  • 维度混淆:忽视标量、向量、矩阵在不同场景下的微分形式差异

典型案例:在经济学Cobb-Douglas生产函数$Y=AK^αL^β$中,要分析产出Y对劳动投入L的变化率$\frac{dY}{dL}$时,如果直接写$\frac{\partial Y}{\partial L}$就忽略了K也可能随L变化的事实。

2. 计算图:链式法则的可视化引擎

计算图(Computational Graph)是理解多元复合函数求导的瑞士军刀。以$z = f(x,y), x=u+v, y=uv$为例:

u v \ / x / \ z y \ w

这张图揭示了三个核心规则:

  1. 节点法则:每个变量都是节点,箭头表示依赖关系
  2. 路径求和:从因变量到自变量的每条路径对应一个乘积项
  3. 维度匹配:确保每个偏导数的数学对象类型一致

2.1 实际应用:物理系统中的温度传导

假设某材料温度分布$T(x,y)$,而测量路径为$x=2t^2$, $y=\sin t$,求温度随时间变化率:

# 计算图路径分析 T ← x ← t T ← y ← t

对应求导公式: $$ \frac{dT}{dt} = \frac{\partial T}{\partial x}\frac{dx}{dt} + \frac{\partial T}{\partial y}\frac{dy}{dt} = T_x(4t) + T_y(\cos t) $$

3. 三类必须掌握的复合函数结构

3.1 单变量链条型

神经网络中的反向传播就是典型应用:

Loss ← h ← g ← f ← x

求导规律: $$ \frac{dLoss}{dx} = \frac{\partial Loss}{\partial h}\frac{\partial h}{\partial g}\frac{\partial g}{\partial f}\frac{\partial f}{\partial x} $$

3.2 多变量汇聚型

经济学中的边际替代率分析:

Utility ← Food ← Clothing

偏导数矩阵形式: $$ \begin{bmatrix} \frac{\partial U}{\partial F} & \frac{\partial U}{\partial C} \end{bmatrix}

\begin{bmatrix} \frac{\partial U}{\partial x} & \frac{\partial U}{\partial y} \end{bmatrix} \begin{bmatrix} \frac{\partial x}{\partial F} & \frac{\partial x}{\partial C} \ \frac{\partial y}{\partial F} & \frac{\partial y}{\partial C} \end{bmatrix} $$

3.3 循环依赖型

热力学系统中的Maxwell关系式:

P ← V T → S

需要特别注意二阶偏导的对称性: $$ \frac{\partial}{\partial T}\left(\frac{\partial P}{\partial S}\right)_V = \frac{\partial}{\partial S}\left(\frac{\partial P}{\partial T}\right)_V $$

4. 从计算图到实际计算的五个步骤

以机器人运动学中的雅可比矩阵计算为例:

  1. 绘制依赖图:标出末端执行器位置$(x,y)$与关节角$θ_1,θ_2$的关系
  2. 标记路径
    x ← θ1 x ← θ2 y ← θ1 y ← θ2
  3. 建立矩阵方程: $$ \begin{bmatrix} dx \ dy \end{bmatrix}

    \begin{bmatrix} \frac{\partial x}{\partial θ_1} & \frac{\partial x}{\partial θ_2} \ \frac{\partial y}{\partial θ_1} & \frac{\partial y}{\partial θ_2} \end{bmatrix} \begin{bmatrix} dθ_1 \ dθ_2 \end{bmatrix} $$
  4. 验证维度:确保$2×2$矩阵乘$2×1$向量得到$2×1$结果
  5. 几何验证:检查当$θ_2=0$时,结果是否退化为单关节情况

5. 避开常见陷阱的实战技巧

在金融工程课上,一个关于期权定价的案例让我印象深刻。当对Black-Scholes公式$C(S,t)$求$\frac{\partial C}{\partial t}$时,有同学忽略了$S$本身也可能随时间变化:

正确做法

  1. 先明确$S$是否是$t$的函数
  2. 如果是,则计算全导数: $$ \frac{dC}{dt} = \frac{\partial C}{\partial t} + \frac{\partial C}{\partial S}\frac{dS}{dt} $$
  3. 如果否,则直接取偏导$\frac{\partial C}{\partial t}$

其他实用技巧:

  • 颜色标记法:用不同颜色标注计算图中的不同路径
  • 单位检验:检查每个偏导数的物理量单位是否合理
  • 特殊值验证:代入0、1等特殊值验证公式正确性

在完成这些年的教学后发现,真正理解链式法则的学生往往会在作业本边缘画满各种依赖关系图。这种视觉化思维不仅解决了记忆负担,更建立了对多元微积分的直觉理解——这才是数学工具应有的打开方式。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/19 4:28:25

2026年50英寸电视选购指南:多品牌推荐及价格、功能全解析!

选购新电视的三大关键因素购买新电视时,前三大需要考虑的因素为画质、屏幕尺寸和色彩对比度。依据空间大小,可选择50英寸、55英寸、65英寸、75英寸甚至更大尺寸的电视,用于观看喜欢的节目、电影以及玩游戏。若想选一台适合公寓或卧室的50英寸…

作者头像 李华
网站建设 2026/4/19 4:20:52

专业NCM文件解密指南:高效解锁网易云音乐加密音频的完整解决方案

专业NCM文件解密指南:高效解锁网易云音乐加密音频的完整解决方案 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 项目概述与技术原理 NCMDump是一款专注于解密网易云音乐NCM加密格式的专业工具,它能够将受版…

作者头像 李华
网站建设 2026/4/19 4:17:52

jQuery 效果- 动画

jQuery 效果:自定义动画 (Custom Animations) jQuery 的 .animate() 方法是其动画系统的核心,它允许你通过改变 CSS 属性(如宽度、高度、位置、透明度等)来创建自定义动画。与内置的 fadeIn、slideUp 不同,.animate() …

作者头像 李华
网站建设 2026/4/19 4:16:51

用C++和Eigen库从零实现一个简易MPC控制器(附完整代码和调参心得)

从零构建MPC控制器:C与Eigen库实战指南 1. 理解MPC的核心思想 模型预测控制(MPC)本质上是一种基于模型的闭环优化控制策略。想象你正在驾驶一辆汽车,不仅要考虑当前的方向盘角度和油门位置,还要预测未来几秒内车辆的轨…

作者头像 李华
网站建设 2026/4/19 4:16:47

CSS Grid布局如何实现项目在网格内填充_掌握justify-items属性

justify-items 未生效的主因是容器未设 display: grid/inline-grid;它仅作用于直系网格项,受 min-width、justify-self 和绝对定位等限制,且 IE11 不支持。justify-items 设置后项目没填满单元格?检查 display 值是否为 grid很多情…

作者头像 李华