news 2026/5/12 7:18:10

统计学习方法1.4~1.8

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
统计学习方法1.4~1.8

1.5 正则化与交叉验证

范数是一个数学概念,用来度量一个向量或矩阵的“大小”或“长度”。

你可以把它直观地理解为从原点到该点(向量)的距离。范数将向量映射成一个非负的数值,这个数值越大,表示向量“越长”或“越大”。

所以正则化项一般就是模型参数向量(所有参数作为分量构成的一个向量)的一个范数。它可以指示参数的“大小”,进而体现模型的复杂度。

  • 奥卡姆剃刀原意是:“如无必要,勿增实体”——简单的解释往往比复杂的更好。

  • 应用到模型选择上就是:在能正确拟合数据的前提下,选那个结构更简单的模型
    比如,一条直线能大致拟合数据,就不要用弯弯曲曲的高次曲线,否则可能只是“死记硬背”了训练数据(过拟合)。

  • 从贝叶斯角度看,模型参数不是一个固定值,而是一个随机变量,有自己的先验分布(训练前我们对参数的已有信念)。

  • 我们可以假设:简单的参数值(比如接近0或很多为0)出现概率大复杂的参数(非常大或很多非零)出现概率小
    这正好对应:复杂模型 ↔ 较小的先验概率。

  • 贝叶斯定理告诉我们:后验概率 ∝ 似然(数据拟合度)× 先验概率
    最大化后验概率 ≈ 同时最大化拟合度 + 最大化先验概率。(参考数学基础复习那一篇)

  • 取负对数后,最大化后验就变成了最小化(损失函数 + 先验项的负对数)
    这个先验项的负对数,恰好就是正则化项。

1.6 泛化能力

定理解读:

1.7 生成模型和判别模型

1.8 监督学习应用

分类(主要考虑二分类)

将所求的类(主要关注的类)称为“正类”,其他所有类称为“负类”

True Positive False Positive

False Negative True Negative

精确率P:在预测为正类的数据之中 正确预测的数据

召回率R:在实际的正类数据之中 有哪些是预测正确的

希望精确率和召回率都是越高越好

调和值F1:P和R的调和平均值

标注

回归

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/12 7:15:44

ARM PMU架构解析与性能监控实战指南

1. ARM PMU架构概述性能监控单元(Performance Monitoring Unit, PMU)是现代处理器中用于硬件性能分析的关键组件。在ARM架构中,PMU通过一组可编程事件计数器实现对微架构事件的监测,包括指令执行、缓存命中、分支预测等关键性能指标。1.1 PMU核心组件ARM…

作者头像 李华
网站建设 2026/5/12 7:08:35

DAB转换器软启动技术:可变死区时间控制解析

1. DAB转换器软启动技术背景解析在电力电子系统中,双有源桥(Dual Active Bridge, DAB)转换器凭借其双向功率传输能力、高频电气隔离特性以及出色的功率密度,已成为电动汽车充电、数据中心供电等关键应用的首选拓扑。然而在实际工程应用中,启动…

作者头像 李华
网站建设 2026/5/12 7:06:32

DH1766线性可编程电源选购与上手避坑指南:从开箱到Python控制第一行代码

DH1766线性可编程电源从开箱到Python控制全流程实战指南 刚拿到DH1766这款专业级可编程电源时,面对密密麻麻的接口和厚厚的说明书,不少工程师都会感到无从下手。作为一款支持三路独立输出的高精度线性电源,DH1766在实验室电源管理、自动化测试…

作者头像 李华
网站建设 2026/5/12 7:02:41

Notepad++ 保姆级安装配置教程,一篇搞定入门

当学历内卷与岗位内卷成为压在年轻人身上的两座大山,一条鲜为人知的黄金赛道正在悄然敞开——网络安全工程师。这里不看你的毕业院校排名,不要求5年工作经验起步,甚至零基础3-5个月集训即可上岗,应届生起薪轻松破万! …

作者头像 李华