news 2026/5/23 13:45:17

Logits与softmax

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Logits与softmax

参考内容:

(59 封私信 / 30 条消息) 知识蒸馏技术(教师学生模型) - 知乎

(59 封私信 / 30 条消息) 深度学习高温蒸馏:Softmax With Temperature - 知乎

1. Logits(未归一化;非概率)

Logits 是深度学习模型预测过程中最后一层输出的原始值。它们通常是一个未归一化的实数向量,每个值对应一个类别。Logits 的取值范围可以是正数、负数,甚至非常大或非常小的值。

Logits 是模型预测的中间结果。它们本身并非最终的预测值,而需要通过激活函数(如 Softmax)进行归一化,转化为概率分布。模型的优化目标(如交叉熵损失)直接基于 Logits 或其归一化结果进行计算。

2. softmax输出(归一化后;概率):Softmax 是一个将 Logits 转化为概率分布的激活函数

1常规softmax

2带温度的softmax

其中T是softmax函数的温度超参数。

引入T的原因:使用softmax会将一个差别不大的输出变成很极端的分布,引入温度系数后softmax的soft程度变成可以调节的超参数。T越高,softmax的output probability distribution越趋于平滑,其分布的熵越大,负标签携带的信息会被相对地放大,模型训练将更加关注负标签。

3. 为什么模型输出最好加上softmax,而当使用交叉熵作为损失函数时不用加:

  • 不加softmax输出的不是概率,Logits数据可能为负数;
  • 大多数深度学习框架(如 PyTorch、TensorFlow)中的交叉熵损失函数内部已经包含了 softmax 的计算
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/2 15:20:07

用代码绘制动态艺术:particles.js物理动画深度解析

用代码绘制动态艺术:particles.js物理动画深度解析 【免费下载链接】particles.js A lightweight JavaScript library for creating particles 项目地址: https://gitcode.com/gh_mirrors/pa/particles.js 在数字艺术的世界里,有一种特殊的视觉语…

作者头像 李华
网站建设 2026/5/12 13:54:27

明日方舟界面美化终极指南:5步打造专属游戏UI

明日方舟界面美化终极指南:5步打造专属游戏UI 【免费下载链接】arknights-ui H5 复刻版明日方舟游戏主界面 项目地址: https://gitcode.com/gh_mirrors/ar/arknights-ui 想要为《明日方舟》打造独一无二的个性化界面吗?Arknights-UI项目为您提供了…

作者头像 李华
网站建设 2026/5/12 13:54:31

数据库管理工具无限试用终极指南:告别14天限制的完整方案

数据库管理工具无限试用终极指南:告别14天限制的完整方案 【免费下载链接】navicat_reset_mac navicat16 mac版无限重置试用期脚本 项目地址: https://gitcode.com/gh_mirrors/na/navicat_reset_mac 还在为专业数据库管理工具的试用期到期而烦恼吗&#xff1…

作者头像 李华
网站建设 2026/5/19 23:12:34

R语言在气象预测中的应用(十年经验精华总结)

第一章:R语言在气象预测中的趋势分析概述R语言凭借其强大的统计计算与可视化能力,已成为气象科学领域中趋势分析的重要工具。随着全球气候变化加剧,对气温、降水、风速等气象要素的长期趋势进行建模与预测变得尤为关键。R提供了丰富的包生态系…

作者头像 李华
网站建设 2026/5/14 5:52:48

为什么顶尖团队都在用Laravel 13的多模态监听?(内部架构首次曝光)

第一章:Laravel 13 多模态监听的演进与核心价值Laravel 13 引入了多模态事件监听机制,标志着框架在异步通信与系统解耦方面迈出了关键一步。该机制允许单一事件被多个监听器以不同模式(如同步、队列、广播)响应,从而适…

作者头像 李华
网站建设 2026/5/20 10:05:40

HunyuanVideo-Foley在微PE官网系统中的轻量化部署尝试

HunyuanVideo-Foley在微PE官网系统中的轻量化部署尝试 在数字内容创作日益普及的今天,短视频、直播和影视后期对音效制作的需求正以前所未有的速度增长。然而,传统音效生成依赖专业人员手动匹配动作与声音,流程繁琐、成本高昂,尤其…

作者头像 李华