news 2026/4/25 10:52:07

使用正则化避免模型过拟合

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
使用正则化避免模型过拟合

一、为什么会过拟合

模型太 “自由”,权重 w 变得特别大:

对训练集噪声、异常点过度学习
训练集损失极低,测试集 / 新数据效果很差
直观:权重越大,函数曲线越扭曲、波动越剧烈

二、正则化核心思想

在损失函数里多加一项「惩罚项」:

限制权重 w 不能太大,强制参数变平滑、简单模型不要太 “极端”,从而抑制过拟合

三、逻辑回归 原版损失(无正则)

四、L2 正则化(最常用,权重衰减)

1.公式

  • λ:正则化系数(超参数)
  • λ=0:无正则 λ 越大:惩罚越强,权重越小,越不容易过拟合
  • 只惩罚权重 w,不惩罚偏置 b(行业通用做法)

2. 作用

  • 让所有权重趋近于 0 但不为 0

  • 压缩参数大小,限制模型复杂度

  • 特征全部保留,适合大部分场景(逻辑回归默认 L2)

五、L1 正则化(稀疏化)

1. 公式

2. 作用

  • 会让不重要特征的权重直接变成 0
  • 自动特征选择、降维
  • 产生稀疏模型,特征多、冗余大时好用

六、关键总结

  • 过拟合本质:参数 w 过大,模型太复杂

  • 正则化本质:惩罚大权重,限制模型复杂度

  • L2 正则:权重变小、平滑、通用首选

  • L1 正则:权重置零、自动筛特征

  • λ 调参

  • 太小 → 正则弱,依旧过拟合

  • 太大 → 权重被压太小,欠拟合

七、延伸:

逻辑回归:

过拟合时部分 w 爆炸式变大;加 L1/L2 惩罚,强行按住 w,完美闭环。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/25 10:48:39

Rust的#[derive(Hash, PartialEq, Eq)]派生宏

Rust语言中的派生宏是简化代码的利器,其中#[derive(Hash, PartialEq, Eq)]的组合尤为实用。它允许开发者通过一行代码自动为结构体或枚举实现多个关键trait,大幅提升开发效率。对于需要哈希计算或相等比较的场景,这个宏能避免大量重复劳动。本…

作者头像 李华
网站建设 2026/4/25 10:44:20

23岁亿万富豪创立的Mercor,陷员工舞弊、安全漏洞与文化困境

数据标注初创公司Mercor年化营收破10亿美元,却面临系列挑战数据标注初创公司Mercor由三名二十多岁的年轻人于2023年创立,今年早些时候,公司年化营收突破10亿美元。然而,如今这家公司正面临一系列挑战,包括员工挪用公款…

作者头像 李华
网站建设 2026/4/25 10:42:28

Mediafire批量下载神器:Python脚本让你轻松下载整个文件夹

Mediafire批量下载神器:Python脚本让你轻松下载整个文件夹 【免费下载链接】mediafire_bulk_downloader Script for bulk downloading entire mediafire folders for free using python. 项目地址: https://gitcode.com/gh_mirrors/me/mediafire_bulk_downloader …

作者头像 李华
网站建设 2026/4/25 10:42:18

STM32CubeMX实战:5分钟搞定TM1622/HT1622液晶驱动(附完整工程源码)

STM32CubeMX实战:5分钟构建TM1622/HT1622液晶驱动框架 液晶驱动开发一直是嵌入式工程师的必修课。记得我第一次接触TM1622驱动芯片时,花了整整两天时间研究数据手册和调试时序。直到发现STM32CubeMX这个神器,才意识到原来配置过程可以如此高效…

作者头像 李华