
如果我们知道各层方差(例如,样本的方差),我们可以使用公式 σ^2 = (样本方差 * (n-1)) / √(n-1) 来估计总体的方差。
以下是这个公式的解释:
- σ^2 是总体方差,σ^2 是我们的目标。
- (样本方差 * (n-1)) 是我们用来估计总体方差的样本方差的数量。
- n 是我们的样本量,我们用 n-1 来估计总体的数量,因为我们知道的是 n-1 层的方差,不知道第 n 层的方差。
- √(n-1) 是用来缩放我们的估计值的,使它们成为正的,以符合正态分布。
因此,通过使用这个公式,我们可以根据我们对各层方差的了解,来估计总体方差。这个公式是基于中心极限定理的,它的基本思想是,当你的样本量足够大时,样本方差的数量约等于总体方差。
如果已知各层的方差和样本数,可以通过加权平均的方式求得总体方差。具体来说,设第 ii 层有 n_in
i
个样本,方差为 sigma_i^2σ
i
2
,总体样本数为 N=sum_{i=1}^k n_iN=∑
i=1
k
n
i
,则总体方差为:
sigma^2=frac{sum_{i=1}^k(n_i-1)sigma_i^2}{N-k}
σ
2
=
N−k
∑
i=1
k
(n
i
−1)σ
i
2
其中,kk 表示层数。这个公式的分子是各层样本方差的自由度校正后的加权和,分母是总体自由度数减去层数,即 N-kN−k。这个公式也可以写成:
sigma^2=frac{sum_{i=1}^k(n_i-1)(ar{x}_i-ar{x})^2}{N-k}
σ
2
=
N−k
∑
i=1
k
(n
i
−1)(
x
ˉ
i
−
x
ˉ
)
2
其中,ar{x}_i
x
ˉ
i
表示第 ii 层样本的均值,ar{x}
x
ˉ
表示总体样本的均值。这个公式的分子是各层样本均值与总体均值之差的平方的自由度校正后的加权和,分母同样是总体自由度数减去层数。
需要注意的是,这个公式假设各层样本方差相同,如果各层样本方差不同,则需要使用更复杂的公式来计算总体方差。