news 2026/5/16 18:44:03

L1正则与次梯度

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
L1正则与次梯度
    • L1:稀疏权重、解易落在轴上、特征选择(应用场景)、w=0w=0w=0不可导需次梯度

      • subgradient:∂f(x)={g∣f(y)≥f(x)+gT(y−x),∀ y∈dom f}\partial f(x)=\{g|f(y)\geq f(x) + g^T(y-x),\forall\ y\in \text{dom}\ f \}f(x)={gf(y)f(x)+gT(yx),ydomf}

      • $$
        \begin{bmatrix}
        g\
        -1
        \end{bmatrix}
        \begin{pmatrix}
        \begin{bmatrix}
        y\
        t
        \end{bmatrix}

        \begin{bmatrix}
        x\
        f(x)
        \end{bmatrix}
        \end{pmatrix}
        \leq 0, \forall (y,t)\in \text{epi}\ f
        $$

      • 对于光滑的可导曲线,即为其切线

      • 对于非光滑(不可导)的凸函数fff,在点xxx处的次梯度不再唯一,而是构成一个次微分的凸集合∂f(x)\partial f(x)f(x)

        • 每个g∈∂f(x)g \in \partial f(x)gf(x)都确定一个支撑超平面:
          t=f(x)+gT(y−x)t = f(x) + g^{\mathsf T}(y - x)t=f(x)+gT(yx)
          该超平面过点(x,f(x))(x, f(x))(x,f(x)),且上镜图epi f\text{epi}\ fepif全部位于该超平面上方

        • 这些支撑超平面构成一个支撑超平面族(平面束),它们的包络就是函数图像。∂f(x)\partial f(x)f(x)越大(越"宽"),说明该点越"不光滑"。
          几何直观:在不可导点处,可以作出无穷多条不同斜率的支撑线,它们夹成一个"锥形"区域,函数图像在这个锥的"尖端"处发生转折。

        • ∂f(x)\partial f(x)f(x)恰是这些支撑超平面法向量的前nnn个分量(最后一个分量为−1-11保证朝下)的全体。

支撑超平面分离超平面
涉及集合单个凸集两个不相交凸集
接触性必接触集合边界(至少一点)可以不接触任何一个集合
几何含义"托住"凸集,集合全在某一侧将两个集合"隔开",各在一侧
唯一性边界光滑点唯一,非光滑点不唯一强分离唯一(一般若不唯一)
关系支撑超平面 = 分离"集合"与"集合外一点"的特殊分离超平面一般分离超平面未必是支撑超平面

核心关系:过凸集边界点x0x_0x0的支撑超平面,等价于分离该凸集与单点集{x0}\{x_0\}{x0}的分离超平面;但分离两个一般凸集的超平面可能不与任一集合接触,因此不一定是支撑超平面。

支撑超平面 vs 分离超平面:示例说明


示例 1:是支撑超平面,也是分离超平面(特殊重合)

考虑凸集为单位圆盘:
C={(x,y)∣x2+y2≤1}C = \{(x,y) \mid x^2 + y^2 \leq 1\}C={(x,y)x2+y21}

在边界点(1,0)(1,0)(1,0)处,直线x=1x = 1x=1满足:

  • 支撑超平面CCC全部落在x≤1x \leq 1x1半空间,且直线与CCC接触于点(1,0)(1,0)(1,0)
  • 同时它也是分离CCC与外部单点{(1,0)}\{(1,0)\}{(1,0)}分离超平面(非严格分离)

支撑超平面本质上就是分离「凸集」与「其边界上一点」的分离超平面。


示例 2:是分离超平面,但不是支撑超平面(典型区别)

考虑两个不相交的开圆盘:
A={(x,y)∣x2+y2<1}A = \{(x,y) \mid x^2 + y^2 < 1\}A={(x,y)x2+y2<1}
B={(x,y)∣(x−3)2+y2<1}B = \{(x,y) \mid (x-3)^2 + y^2 < 1\}B={(x,y)(x3)2+y2<1}

直线是否分离 A 和 B?是否接触 A?是否接触 B?结论
x=1.5x = 1.5x=1.5❌ 不接触❌ 不接触纯分离超平面,非任何一方的支撑
x=1x = 1x=1✅ 接触 A❌ 不接触分离超平面,且是 A 的支撑超平面
x=2x = 2x=2❌ 不接触✅ 接触 B分离超平面,且是 B 的支撑超平面

直观理解:分离超平面只需"从中间穿过把两边隔开",可以不碰任何一方;支撑超平面必须"托住"集合。


示例 3:非光滑点处的支撑超平面束(次梯度可视化)

考虑f(x)=∣x∣f(x) = |x|f(x)=x,考察点x=0x = 0x=0(不可导点)。

次微分∂f(0)=[−1,1]\partial f(0) = [-1, 1]f(0)=[1,1],其中每一个g∈[−1,1]g \in [-1,1]g[1,1]都对应一个支撑超平面:
t=g⋅(y−0)+0=gyt = g \cdot (y - 0) + 0 = g yt=g(y0)+0=gy

即直线族{t=gy∣−1≤g≤1}\{t = gy \mid -1 \leq g \leq 1\}{t=gy1g1}

  • g=−1g = -1g=1t=−yt = -yt=y(最左侧支撑线,斜率−1-11
  • g=0g = 0g=0t=0t = 0t=0(水平支撑线)
  • g=1g = 1g=1t=yt = yt=y(最右侧支撑线,斜率111

所有支撑线在(0,0)(0,0)(0,0)处交汇,形成一个"锥形束",上镜图epi f\text{epi}\ fepif位于每条线的上方。这体现了非光滑点处支撑超平面不唯一的特点。


示例 4:既是双方支撑超平面,但不严格分离

两个闭圆盘相切:
A={(x,y)∣x2+y2≤1}A = \{(x,y) \mid x^2 + y^2 \leq 1\}A={(x,y)x2+y21}
B={(x,y)∣(x−2)2+y2≤1}B = \{(x,y) \mid (x-2)^2 + y^2 \leq 1\}B={(x,y)(x2)2+y21}

在切点(1,0)(1,0)(1,0)处,直线x=1x = 1x=1同时是AAABBB支撑超平面,也是它们的分离超平面(非严格)。但不存在严格分离超平面(无法让两者分居两侧且都不接触),因为A∩B={(1,0)}≠∅A \cap B = \{(1,0)\} \neq \varnothingAB={(1,0)}=

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/16 18:39:11

3PEAK思瑞浦 TPA1861-TR SOT23-5 精密运放

特性 供电电压:4.5伏至40伏或2.25伏至20伏 偏移电压:最大30伏 .差分输入电压范围至电源轨&#xff0c;可作为比较器工作 输入轨至-Vs&#xff0c;轨到轨输出 驱动任意电容负载 带宽:6MHz&#xff0c;斜率:5V/us 优异的EMI抑制性能:1GHz时85dB 过温保护 低噪声:1kHz时8nV/√Hz 2…

作者头像 李华
网站建设 2026/5/16 18:35:16

WeChatPad:打破微信设备限制,实现手机平板双登录的智能方案

WeChatPad&#xff1a;打破微信设备限制&#xff0c;实现手机平板双登录的智能方案 【免费下载链接】WeChatPad 强制使用微信平板模式 项目地址: https://gitcode.com/gh_mirrors/we/WeChatPad 你是否曾因为微信"手机和平板不能同时在线"的限制而感到困扰&…

作者头像 李华
网站建设 2026/5/16 18:29:06

ThinkPad风扇控制2.0:释放笔记本散热潜能的终极指南

ThinkPad风扇控制2.0&#xff1a;释放笔记本散热潜能的终极指南 【免费下载链接】TPFanCtrl2 ThinkPad Fan Control 2 (Dual Fan) for Windows 10 and 11 项目地址: https://gitcode.com/gh_mirrors/tp/TPFanCtrl2 在Windows 10和11系统上&#xff0c;ThinkPad用户现在可…

作者头像 李华
网站建设 2026/5/16 18:28:04

RPG游戏逻辑自动化:开源框架RPG Mais与n8n工作流集成实践

1. 项目概述&#xff1a;当开源RPG框架遇上自动化工作流最近在折腾一个挺有意思的项目&#xff0c;叫RPGMais/mcp-n8n。乍一看这个标题&#xff0c;你可能有点懵&#xff0c;这串字母组合到底意味着什么&#xff1f;简单来说&#xff0c;这是一个桥梁&#xff0c;一个连接器。它…

作者头像 李华