本文重点
在概率论与数理统计中,样本分布是一个核心概念,它为我们提供了从总体中抽取的样本数据的概率分布特征,是进行统计推断和假设检验的基础。
样本的二重性----数的属性和随机变量的属性
- 假设 X1, X2, …, Xn是总体X的样本,在一次具体的观测或试验中,它们是一批测量值,是已经取到的一组数。比如说测量物体的长度,样本X1, X2, …, Xn可能是(10,10.01,....,10.03),这就是说,样本具有数的属性。
- 由于在具体试验或观测中,受各种随机因素的影响,在不同试验或观测中,样本取值可能不同,也就是说每次试验获取到的样本都不同,有的时候样本X1, X2, …, Xn可能是(10,10.01,....,10.03),而有的时候样本X1, X2, …, Xn可能是(10.03,10.01,....,10),因此,当脱离特定的具体试验或观测时,我们并不知道样本 X1,X2,…,Xn 的具体取值到底是多少。因此, 可将样本看成随机变量。所以说样本又具有随机变量的属性。
随机样本
在概率统计理论,随机过程,任何时刻的取值都为随机变量,如果这些随机变量服从同一分布,并且互相独立,那么这些随机变量是独立同分布,这个之前介绍过。
什么是随机样本呢?如果在相同条件下对总体X进行n次重复、独立观测,就可以认为所获得的样本X1,X2,…,Xn是n个独立且与总体X有同样分布的随机变量。也就是每次的观测xi都是一个随机变量,这个随机变量的分布和总体的分布是一样的。
在统计文献中,称相互独立且有相同分布的样本为随机样本或简单样本, n 为样本大小或样本容量。