别再死记硬背链式法则了！用一张图+三个例子彻底搞懂多元复合函数求导-开发者社区

多元复合函数求导：用计算图破解链式法则的思维困局

第一次看到多元复合函数的链式法则时，大多数人的反应都是"这公式怎么长得像化学方程式"。当教科书上突然抛出$\frac{\partial z}{\partial s}=\frac{\partial z}{\partial x}\frac{\partial x}{\partial s}+\frac{\partial z}{\partial y}\frac{\partial y}{\partial s}$这样的表达式时，那些下标和分数线的组合简直就像天书。但当我发现可以用一张图解决所有问题时，整个多元微积分突然变得清晰起来——这就是计算图的魔力。

1. 为什么传统记忆方法总是失效

在物理系大三那年，我目睹了同学在热力学考试中把$\frac{\partial T}{\partial P}$写成$\frac{\partial P}{\partial T}$的惨剧。这种错误不是粗心，而是对链式法则本质理解缺失的必然结果。传统教学常犯三个致命错误：

符号滥用：用相同的$\frac{\partial z}{\partial x}$表示不同上下文中的偏导数，实际上在复合函数$z=f(x(u,v),y(u,v))$中，$\frac{\partial z}{\partial x}$与$\frac{\partial x}{\partial u}$有着本质区别
路径缺失：没有可视化变量间的依赖关系，导致求导时遗漏路径
维度混淆：忽视标量、向量、矩阵在不同场景下的微分形式差异

典型案例：在经济学Cobb-Douglas生产函数$Y=AK^αL^β$中，要分析产出Y对劳动投入L的变化率$\frac{dY}{dL}$时，如果直接写$\frac{\partial Y}{\partial L}$就忽略了K也可能随L变化的事实。

2. 计算图：链式法则的可视化引擎

计算图（Computational Graph）是理解多元复合函数求导的瑞士军刀。以$z = f(x,y), x=u+v, y=uv$为例：

u v \ / x / \ z y \ w

这张图揭示了三个核心规则：

节点法则：每个变量都是节点，箭头表示依赖关系
路径求和：从因变量到自变量的每条路径对应一个乘积项
维度匹配：确保每个偏导数的数学对象类型一致

2.1 实际应用：物理系统中的温度传导

假设某材料温度分布$T(x,y)$，而测量路径为$x=2t^2$, $y=\sin t$，求温度随时间变化率：

# 计算图路径分析 T ← x ← t T ← y ← t

对应求导公式： $$ \frac{dT}{dt} = \frac{\partial T}{\partial x}\frac{dx}{dt} + \frac{\partial T}{\partial y}\frac{dy}{dt} = T_x(4t) + T_y(\cos t) $$

3. 三类必须掌握的复合函数结构

3.1 单变量链条型

神经网络中的反向传播就是典型应用：

Loss ← h ← g ← f ← x

求导规律： $$ \frac{dLoss}{dx} = \frac{\partial Loss}{\partial h}\frac{\partial h}{\partial g}\frac{\partial g}{\partial f}\frac{\partial f}{\partial x} $$

3.2 多变量汇聚型

经济学中的边际替代率分析：

Utility ← Food ← Clothing

偏导数矩阵形式： $$ \begin{bmatrix} \frac{\partial U}{\partial F} & \frac{\partial U}{\partial C} \end{bmatrix}

\begin{bmatrix} \frac{\partial U}{\partial x} & \frac{\partial U}{\partial y} \end{bmatrix} \begin{bmatrix} \frac{\partial x}{\partial F} & \frac{\partial x}{\partial C} \ \frac{\partial y}{\partial F} & \frac{\partial y}{\partial C} \end{bmatrix} $$

3.3 循环依赖型

热力学系统中的Maxwell关系式：

P ← V T → S

需要特别注意二阶偏导的对称性： $$ \frac{\partial}{\partial T}\left(\frac{\partial P}{\partial S}\right)_V = \frac{\partial}{\partial S}\left(\frac{\partial P}{\partial T}\right)_V $$

4. 从计算图到实际计算的五个步骤

以机器人运动学中的雅可比矩阵计算为例：

绘制依赖图：标出末端执行器位置$(x,y)$与关节角$θ_1,θ_2$的关系
标记路径：
```
x ← θ1 x ← θ2 y ← θ1 y ← θ2
```
建立矩阵方程： $$ \begin{bmatrix} dx \ dy \end{bmatrix}
\begin{bmatrix} \frac{\partial x}{\partial θ_1} & \frac{\partial x}{\partial θ_2} \ \frac{\partial y}{\partial θ_1} & \frac{\partial y}{\partial θ_2} \end{bmatrix} \begin{bmatrix} dθ_1 \ dθ_2 \end{bmatrix} $$
验证维度：确保$2×2$矩阵乘$2×1$向量得到$2×1$结果
几何验证：检查当$θ_2=0$时，结果是否退化为单关节情况

5. 避开常见陷阱的实战技巧

在金融工程课上，一个关于期权定价的案例让我印象深刻。当对Black-Scholes公式$C(S,t)$求$\frac{\partial C}{\partial t}$时，有同学忽略了$S$本身也可能随时间变化：

正确做法：

先明确$S$是否是$t$的函数
如果是，则计算全导数： $$ \frac{dC}{dt} = \frac{\partial C}{\partial t} + \frac{\partial C}{\partial S}\frac{dS}{dt} $$
如果否，则直接取偏导$\frac{\partial C}{\partial t}$

其他实用技巧：