news 2026/5/5 18:45:55

Huber损失函数:前面像平方误差(更平滑)、后面像绝对误差(不怕离群点)”的误差函数。它用来衡量预测值和真实值的差距,比纯平方误差更不容易被极端错误样本“带偏”

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Huber损失函数:前面像平方误差(更平滑)、后面像绝对误差(不怕离群点)”的误差函数。它用来衡量预测值和真实值的差距,比纯平方误差更不容易被极端错误样本“带偏”

Huber 损失是一种“前面像平方误差(更平滑)、后面像绝对误差(不怕离群点)”的误差函数。它用来衡量预测值和真实值的差距,比纯平方误差更不容易被极端错误样本“带偏”。


1) 先定义“误差”

设真实值是y yy,预测值是y ^ \hat yy^,那么误差(残差)是

e = y ^ − y e = \hat y - ye=y^y

我们关心的是误差的大小∣ e ∣ |e|e


2) Huber 损失公式

Huber 损失有一个阈值参数δ > 0 \delta>0δ>0(读作 delta),表示“误差多大算大”。

L δ ( e ) = { 1 2 e 2 , ∣ e ∣ ≤ δ δ ( ∣ e ∣ − 1 2 δ ) , ∣ e ∣ > δ L_\delta(e)= \begin{cases} \frac{1}{2}e^2, & |e|\le \delta \\ \delta\left(|e|-\frac{1}{2}\delta\right), & |e|>\delta \end{cases}Lδ(e)={21e2,δ(e21δ),eδe>δ


3) 高中生直觉理解

把它想成“两段式惩罚”:

当误差不大(∣ e ∣ ≤ δ |e|\le\deltaeδ

用平方惩罚:

L = 1 2 e 2 L=\frac{1}{2}e^2L=21e2

  • 小误差时,平方误差能给出更细腻的惩罚(误差从 1 变 2,损失从 0.5 变 2,增加很多),促使模型把小误差继续磨小。
  • 曲线是圆滑的抛物线,训练更稳定。

当误差很大(∣ e ∣ > δ |e|>\deltae>δ

改用“近似绝对值”的线性惩罚:

L = δ ( ∣ e ∣ − 1 2 δ ) L=\delta\left(|e|-\frac{1}{2}\delta\right)L=δ(e21δ)

  • 这时损失随误差大小线性增长,不像平方那样爆炸。
  • 所以遇到“离群点/标注错误/极端样本”,不会把模型拉得太狠。

4) 为什么要这样“拼接”?

对比两种常见损失:

  • 平方误差(MSE)1 2 e 2 \frac{1}{2}e^221e2
    大误差会被放大得非常厉害(例如误差 10,损失 50),容易被少数离群点主导。

  • 绝对误差(MAE)∣ e ∣ |e|e
    不怕离群点,但在误差接近 0 的地方“尖”,优化时不如平方那样平滑。

Huber就是把两者优点合在一起:

  • 小误差:用平方(平滑、好优化)
  • 大误差:用线性(抗离群点)

5) 一个简单数值例子(取δ = 1 \delta=1δ=1

假设误差e = 0.5 e=0.5e=0.5(小误差):

L = 1 2 × 0.5 2 = 0.125 L=\frac{1}{2}\times 0.5^2=0.125L=21×0.52=0.125

假设误差e = 3 e=3e=3(大误差):

L = 1 × ( 3 − 1 2 × 1 ) = 2.5 L=1\times\left(3-\frac{1}{2}\times1\right)=2.5L=1×(321×1)=2.5

如果用平方误差,1 2 × 3 2 = 4.5 \frac{1}{2}\times 3^2=4.521×32=4.5,会惩罚更猛;Huber 就“温和”很多。


如果你告诉我你的任务里误差是“距离(米)”还是“像素/栅格”,我也可以顺便解释δ \deltaδ一般怎么选(比如和栅格分辨率、噪声尺度对应)。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/4 0:36:22

KLayout 0.29.12:多环境适配的版图工具技术突破

KLayout 0.29.12:多环境适配的版图工具技术突破 【免费下载链接】klayout KLayout Main Sources 项目地址: https://gitcode.com/gh_mirrors/kl/klayout KLayout作为开源版图编辑与查看领域的核心工具,其0.29.12版本通过模块化架构重构与跨环境兼…

作者头像 李华
网站建设 2026/5/4 20:17:11

StructBERT中文-large模型实操手册:自定义文本对相似度计算脚本

StructBERT中文-large模型实操手册:自定义文本对相似度计算脚本 如果你正在寻找一个能准确判断中文文本相似度的工具,那么StructBERT中文-large模型绝对值得你深入了解。这个模型在多个中文相似度数据集上训练,能够帮你快速判断两段文字在语…

作者头像 李华
网站建设 2026/5/1 3:14:00

Qwen3-ForcedAligner开箱即用:快速体验11种语言词级对齐

Qwen3-ForcedAligner开箱即用:快速体验11种语言词级对齐 1. 为什么你需要词级对齐工具? 你是否遇到过这些场景: 录制了一段双语访谈音频,想快速生成带时间戳的逐词字幕,但现有工具要么只支持英文,要么中…

作者头像 李华
网站建设 2026/5/4 15:44:03

YOLO12与数据结构优化:提升模型推理效率

YOLO12与数据结构优化:提升模型推理效率 最近在项目里用上了YOLO12,这个以注意力机制为核心的新版本确实在精度上让人眼前一亮。不过在实际部署时,我发现了一个问题:虽然模型本身的推理速度不错,但整个处理流程的效率…

作者头像 李华
网站建设 2026/5/3 7:57:18

网盘限速终结者?2025年突破下载瓶颈的6大技术方案

网盘限速终结者?2025年突破下载瓶颈的6大技术方案 【免费下载链接】Online-disk-direct-link-download-assistant 可以获取网盘文件真实下载地址。基于【网盘直链下载助手】修改(改自6.1.4版本) ,自用,去推广&#xff…

作者头像 李华
网站建设 2026/5/1 17:20:08

Switch大气层系统安全配置指南:从概念到实践的完整探索

Switch大气层系统安全配置指南:从概念到实践的完整探索 【免费下载链接】Atmosphere-stable 大气层整合包系统稳定版 项目地址: https://gitcode.com/gh_mirrors/at/Atmosphere-stable 概念解析:为什么选择大气层系统? 作为Switch玩家…

作者头像 李华