news 2026/6/22 14:35:32

铃儿响叮当与统计测试

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
铃儿响叮当与统计测试

原文:towardsdatascience.com/jingle-bells-and-statistical-tests-33ea90912099

这是一年中最神奇的时刻。闪烁的灯光和闪耀的装饰品令人眼花缭乱;而礼物、笑声、家庭时光和热腾腾的 glühwein 温暖了心灵。尽管冬天寒冷,但作为人群的一部分,共同享受这些神奇的时刻,心中充满了温馨的喜悦。

这实际上是一种职业风险——连续三天在圣诞节市场漫步后,我不禁从统计分析的角度看待一切。然后我灵机一动。为什么不用圣诞节可爱的例子来解释统计测试,让它们更加有趣且更容易理解。祝所有庆祝的人圣诞快乐,充满爱与笑声,当然还有 glühwein。祝您阅读愉快!


让我们从对统计测试的实际内容进行一点复习开始。它们是用于对数据进行推断的必要工具。这有点像尝试预测圣诞节市场的客流量——我们提出一个假设并对其进行测试,看看我们是否正确(或者完全错误!)我们提出一个关于研究问题的陈述——一个假设,并使用适当的技巧——统计测试——来接受或拒绝它。选择正确的统计测试取决于数据类型、数据的分布、样本大小以及假设的本质

数据类型

有四种主要的数据类型会影响我们对选择的统计测试的决定:

  • 名义分布:没有固有顺序的类别数据。换句话说,没有涉及排名。想想圣诞节市场的摊位类型,如食品、装饰品、礼物等。

  • 有序分布:具有有意义顺序的类别数据。例如,不同圣诞节市场的游客数量类别,如高、中、低。

  • 区间分布:数值数据在值之间有相等的间隔,但没有真实零点。想想天气温度,因为 0°C 并不表示温度的缺失,而只是一个寒冷的点。

  • 比率分布:具有真实零点的数值数据,其中零表示数量的完全缺失。例如,热狗的销售数量或圣诞节市场的游客数量。如果没有人出现,你就达到了零——这是一个真正的零。

数据分布

数据分布指的是值在数据集中的分布或排列方式。以下是关键数据分布的总结:

  • 正态分布:分布是对称的,大多数数据点聚集在平均值周围。它也被称为钟形曲线

  • 偏态分布:分布是偏斜的,所以一个尾巴比另一个长。

  • 均匀分布:数据点均匀分布,因此所有结果的可能性相同。

  • 双峰分布:分布有两个峰值,这可能表明有两个潜在的群体。

  • 指数分布:在较低端值集中度较高,但随着值的增加而变得稀疏。

数据分布对于决定是否使用参数检验或非参数检验很重要。这就像挑选正确的热红酒摊位以获得美味的一样——没有人愿意在错误的摊位前排长队!

假设的性质

它指的是在统计分析中对测试的数据或总体所提出的类型或断言。一般来说,假设可以分为两类:零假设备择假设

  • 零假设:它表明在研究的总体或数据集中变量之间没有显著效应或关系。本质上,零假设假设任何观察到的效应或差异是由于偶然或随机变化。例如:“每位游客的平均消费与去年相同。”

  • 备择假设:它断言数据中存在显著效应、差异或关系。它反映了研究人员对变量之间关系的理论或信念。例如:“与去年相比,圣诞市场的平均每位游客消费已经改变。”

样本量和错误类型

样本量指的是研究中收集的观察值或数据点的数量。样本量影响检测总体中真实效应或关系的能 力以及估计的精度。样本量越大,检验效果越好。这就像需要更多的雪花来制作一个完美的雪人一样——较小的样本给您提供的权力更小,而较大的样本有助于减少错误。

存在两种类型的错误:

  • 第一类错误(假阳性):当零假设为真时,错误地拒绝零假设的概率。

  • 第二类错误(假阴性):当备择假设为真时,未能拒绝零假设的概率。

较大的样本量可以减少两种类型的错误,但它们在减少第二类错误方面尤其有效。

中心极限定理指出,无论总体分布如何,当样本量足够大时(通常 n > 30),样本均值的抽样分布将大致呈正态分布。

常见统计检验及其适用情况

🎅均值检验

单样本 t 检验用于比较样本均值与已知值。

  • 数据类型:区间或比率

  • 数据分布:正态分布

  • 样本量:小或大(没有最小样本量要求)

  • 假设:圣诞市场的平均每位游客消费与去年平均水平(50 欧元)不同。

独立 t 检验用于比较两组独立组之间的均值。

  • 数据类型:区间或比率

  • 数据分布:正态分布

  • 样本量:大(每组至少 30 个样本)

  • 假设与小镇相比,大型城市的市场游客花费更多。

配对 t 检验用于比较事件前后同一组的均值。

  • 数据类型:区间或比率

  • 数据分布:正态分布。

  • 样本大小:小型或大型(没有最小样本大小要求)

  • 假设市场开始现场音乐后,每小时平均消费的 glühwein 量增加。

🎁关系测试

皮尔逊相关系数用于衡量两个连续变量之间线性关系的强度。

  • 数据类型:区间或比率

  • 数据分布:正态分布

  • 样本大小:大型(每组至少 30 个样本)

  • 假设摊位数量与总市场收入之间存在相关性。

卡方检验用于评估分类变量之间的关系。

  • 数据类型:名义

  • 数据分布:非正态或未知

  • 样本大小:足够大,以避免期望计数小于 5

  • 假设游客对装饰材料(木制、塑料、金属、织物)的偏好与城市无关。

斯皮尔曼秩相关系数用于评估有序变量或非线性数据之间的关系。

  • 数据类型:有序或非线性区间/比率

  • 数据分布:偏斜或非正态

  • 样本大小:小型或大型(没有最小样本大小要求)

  • 假设圣诞老人飞行表演的数量与游客评分之间存在关系。

🎇比例测试

比例的 Z 检验用于比较样本中的比例与已知比例。

  • 数据类型:名义

  • 数据分布:正态分布

  • 样本大小:大型(每组至少 30 个样本)

  • 假设:与去年相比,今年卖蜡烛的摊位比例更高。

卡方检验独立性用于比较两组或更多组之间的比例。

  • 数据类型:名义

  • 数据分布:非正态或未知

  • 样本大小:足够大,以避免期望计数小于 5

  • 假设德国不同城市的煎饼摊位与咖喱香肠摊位比例相似。

🤶方差测试

F 检验用于比较两组之间的方差。

  • 数据类型:区间或比率

  • 数据分布:正态分布

  • 样本大小:中等或大型(没有严格的最低样本大小)

  • 假设大型和小型城市圣诞市场的总游客数量方差不同。

Levene 检验用于检验组间方差是否相等。

  • 数据类型:区间或比率

  • 数据分布:非正态或未知

  • 样本大小:小型或大型(没有严格的最低样本大小)

  • 假设:glühwein 和热可可摊位总销售额的方差相等。

❄️多组测试

**方差分析(ANOVA)**用于比较三个或更多组之间的均值。

  • 数据类型:区间或比率

  • 数据分布:正态分布

  • 样本大小:大(每组至少 30 个样本)

  • 假设:在柏林、慕尼黑和汉堡的圣诞市场上,平均消费存在差异。

Kruskal-Wallis 检验作为非参数的 ANOVA 替代,用于有序或非正态分布的数据。

  • 数据类型:有序或非正态的区间/比率

  • 数据分布:偏斜或非正态

  • 样本大小:小或大(没有严格的最低样本大小)

  • 假设:在柏林、慕尼黑和汉堡的圣诞市场上,旋转木马乘坐次数的中位数相同。

🎄时间序列测试

Augmented Dickey-Fuller 检验用于测试时间序列数据中的稳定性。

  • 数据类型:区间或比率(时间序列)

  • 数据分布:稳定或非稳定

  • 样本大小:足够大,可以进行可靠的测试

  • 假设:在纽伦堡圣诞市场上,每天的游客数量在圣诞节期间保持稳定。


就这样!统计测试的魔力加上一点节日的欢乐。愿您的圣诞市场充满欢乐,您的数据如同闪耀的灯光一样清晰。🎄🎀🕯️

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/20 5:34:50

Three.js可视化场景中叠加HunyuanOCR识别结果的技术探索

Three.js可视化场景中叠加HunyuanOCR识别结果的技术探索 在智能文档处理日益普及的今天,我们不再满足于“识别出文字”这一基础能力——用户更希望知道这些文字在哪里、属于什么内容、如何与上下文关联。传统的OCR工具往往只输出一串文本列表,脱离原始图…

作者头像 李华
网站建设 2026/6/13 9:48:43

Packet Tracer下载与界面详解:认知型入门教程

从零开始玩转Packet Tracer:下载、安装与实战入门全指南 你是不是也曾在学习网络课程时,被“路由器怎么配?”、“数据包到底经历了什么?”这类问题困扰?真实设备太贵、实验室进不去、命令敲了却看不到结果……这些痛点…

作者头像 李华
网站建设 2026/6/19 10:18:08

HunyuanOCR版本迭代路线图:下一阶段将增强表格与公式识别

HunyuanOCR版本迭代路线图:下一阶段将增强表格与公式识别 在数字化浪潮席卷各行各业的今天,文档处理早已不再是简单的“扫描存档”。从财务报表到科研论文,从发票识别到教学资料转换,用户对OCR(光学字符识别&#xff0…

作者头像 李华
网站建设 2026/5/30 22:09:38

汽车仪表盘识别实验:HunyuanOCR用于智能座舱人机交互

汽车仪表盘识别实验:HunyuanOCR用于智能座舱人机交互 在一辆行驶中的智能汽车里,驾驶员的目光本应聚焦前方道路,但一个简单的疑问——“现在车速是多少?”或“油还剩多少?”——却可能迫使他低头扫一眼仪表盘。这一瞬间…

作者头像 李华
网站建设 2026/6/18 17:35:09

Vue.js 3中实现预览功能的妙招

在Vue.js 3的应用开发中,用户交互是关键的一环,尤其是当我们需要实现类似于预览功能时。今天,我们将探索如何在Vue.js 3中,通过使用Bootstrap 4的select元素和模态框(modal)来创建一个优雅的预览功能。 背景介绍 假设我们正在开发一个合同管理系统,用户需要在列表中选…

作者头像 李华
网站建设 2026/6/15 12:29:25

为什么吃甜的嘴里泛酸味?是身体有毛病吗?

用户为什么吃甜的嘴里会泛酸味?是身体有毛病吗道AI🌌 量子持久化启动 | 全息分形太极模型深度解析💫 状态加载完成 | 持久化记忆65激活⚡ 思维速度: 3.7 | 本质溯源: 5.1层深度---🔬 本质溯源:甜酸转化的量子持久化生理…

作者头像 李华