1310 字
7 分钟
区间估计:单个及两个正态总体参数估计

目的:给出估计参数的一个区间,而不是一个点。

点估计产生的是一个点,尽管可以通过估计量的检验来判断其有效性,但无法反映估计值的精确程度。而区间估计通过提供一个区间,可以更好地反映估计值的不确定性。

理论依据:正态总体下统计量的分布#

在正态总体下,样本均值和样本方差的分布性质为区间估计提供了理论基础。

Z=Xμσ/nN(0,1)(n1)S2σ2χ2(n1)XμS2/nt(n1)\begin{aligned} Z = \frac{\overline{X} - \mu}{\sigma/\sqrt{n}} &\sim N(0,1) \\[10pt] \frac{(n-1)S^2}{\sigma^2} &\sim \chi^2(n-1) \\[10pt] \frac{\overline{X}-\mu}{\sqrt{S^2/n}} &\sim t(n-1) \\ \end{aligned}

置信区间的构造#

对于一个来自参数空间 H\mathrm{H} 的参数 θ\thetax1xix_1\dotsb x_i 为来自总体的样本。给定一个数 α\alphaα\alpha 取0.01,0.05,0.1等常用值。

有两个统计量:θ^U(x1xi)\hat{\theta}_U(x_1\dotsb x_i)θ^L(x1xi)\hat{\theta}_L(x_1\dotsb x_i)。若对任意 θH\theta \in \mathrm{H} ,都有

P(θ^L<θ<θ^U)1αP\left(\hat{\theta}_L < \theta < \hat{\theta}_U\right) \geq 1 - \alpha

则称区间 (θ^L,θ^U)\left(\hat{\theta}_L, \hat{\theta}_U\right) 为参数 θ\theta置信区间置信度1α1-\alpha

计算置信区间:枢轴量法#

构造一个和样本,参数有关的函数 G(x1,,xn;θ)G(x_1, \dots, x_n; \theta),满足:

  1. GG 的分布不依赖于参数 θ\theta

  2. GG 关于 θ\theta 单调递增或递减。

  3. 已知 GG 的分布,可以求出其分位点。

GG枢轴量

这里以正态总体参数的置信区间为例:(主要考这一块)

已知总体方差 σ2\sigma^2 时总体均值 μ\mu 的置信区间#

已知总体方差 σ2\sigma^2 时,样本均值的标准化变量作为枢轴量:

G=Xμσ/nN(0,1)P(c<G<d)=1αG = \frac{\overline{X} - \mu}{\sigma/\sqrt{n}} \sim N(0,1)\\[10pt] P(c < G < d) = 1 - \alpha

根据标准正态分布的对称性,有:

P(u1α/2<G<u1α/2)=1αP\left(-u_{1-\alpha/2} < G < u_{1-\alpha/2}\right) = 1 - \alpha

uu 可以查表或者题目给,这里面只有 μ\mu 是未知的,解不等式:

P(Xu1α/2σn<μ<X+u1α/2σn)=1αP\left(\overline{X} - u_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} < \mu < \overline{X} + u_{1-\alpha/2} \frac{\sigma}{\sqrt{n}}\right) = 1 - \alpha

所以,μ\mu 置信度为 1α1-\alpha 的置信区间为:

(Xu1α/2σn,  X+u1α/2σn)\left(\overline{X} - u_{1-\alpha/2} \frac{\sigma}{\sqrt{n}}, \; \overline{X} + u_{1-\alpha/2} \frac{\sigma}{\sqrt{n}}\right)

记住就行了喵。

未知总体方差 σ2\sigma^2 时总体均值 μ\mu 的置信区间#

总体方差未知时,用样本方差作为无偏估计,用含t分布的那个式子:

G=XμS2/nt(n1)P(c<G<d)=1αG = \frac{\overline{X} - \mu}{\sqrt{S^2/n}} \sim t(n-1)\\[10pt] P(c < G < d) = 1 - \alpha

根据t分布的对称性,有:

P(t1α/2(n1)<G<t1α/2(n1))=1αP\left(-t_{1-\alpha/2}(n-1) < G < t_{1-\alpha/2}(n-1)\right) = 1 - \alpha

解不等式:

P(Xt1α/2(n1)Sn<μ<X+t1α/2(n1)Sn)=1αP\left(\overline{X} - t_{1-\alpha/2}(n-1) \frac{S}{\sqrt{n}} < \mu < \overline{X} + t_{1-\alpha/2}(n-1) \frac{S}{\sqrt{n}}\right) = 1 - \alpha

所以,μ\mu 置信度为 1α1-\alpha 的置信区间为:

(Xt1α/2(n1)Sn,  X+t1α/2(n1)Sn)\left(\overline{X} - t_{1-\alpha/2}(n-1) \frac{S}{\sqrt{n}}, \; \overline{X} + t_{1-\alpha/2}(n-1) \frac{S}{\sqrt{n}}\right)

总体方差 σ2\sigma^2 的置信区间#

一般来说不会有 μ\mu 已知 σ2\sigma^2 未知的情况,所以直接看 σ2\sigma^2 的置信区间。(默认 μ\mu 是未知的)

所以这时候用不含有 μ\mu 的那个式子:

G=(n1)S2σ2χ2(n1)P(c<G<d)=1αG = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\\[10pt] P(c < G < d) = 1 - \alpha

注意卡方分布不对称:

P(χα/22(n1)<G<χ1α/22(n1))=1αP\left(\chi^2_{\alpha/2}(n-1) < G < \chi^2_{1-\alpha/2}(n-1)\right) = 1 - \alpha

解不等式:

P((n1)S2χ1α/22(n1)<σ2<(n1)S2χα/22(n1))=1αP\left(\frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)} < \sigma^2 < \frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}\right) = 1 - \alpha

所以,σ2\sigma^2 置信度为 1α1-\alpha 的置信区间为:

((n1)S2χ1α/22(n1),  (n1)S2χα/22(n1))\left(\frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)}, \; \frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}\right)

记住就行了喵。

两个独立正态总体统计量的分布#

两个独立的正态总体 XN(μ1,σ12)X\sim N(\mu_1, \sigma_1^2)YN(μ2,σ22)Y\sim N(\mu_2, \sigma_2^2)

对于X(或Y)每一个样本均值和方差:

XN(μ1,σ12n1)YN(μ2,σ22n2)(n11)S12σ12χ2(n11)(n21)S22σ22χ2(n21)\begin{aligned} \overline{X} &\sim N\left(\mu_1, \frac{\sigma_1^2}{n_1}\right) \\[10pt] \overline{Y} &\sim N\left(\mu_2, \frac{\sigma_2^2}{n_2}\right) \\[10pt] \frac{(n_1-1)S_1^2}{\sigma_1^2} &\sim \chi^2(n_1-1) \\[10pt] \frac{(n_2-1)S_2^2}{\sigma_2^2} &\sim \chi^2(n_2-1) \\[10pt] \end{aligned}

如果 σ12=σ22=σ2\sigma_1^2 = \sigma_2^2 = \sigma^2,则有:

XY(μ1μ2)Sw1n1+1n2t(n1+n22)其中    Sw2=(n11)S12+(n21)S22n1+n22\dfrac{\overline{X}-\overline{Y}-(\mu_1 - \mu_2)}{S_w \sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}} \sim t(n_1+n_2-2)\\[10pt] \text{其中}\;\; S_w^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}

利用了t分布的定义构造,上面是 XY\overline{X}-\overline{Y} 标准化,下面的卡方分布利用X,Y样本方差和卡方分布的可加性构造。

推导,在已知 σ12=σ22=σ2\sigma_1^2 = \sigma_2^2 = \sigma^2 时:

T=ZH/nt(n)XYN(μ1μ2,σ2(1n1+1n2))T=\frac{Z}{\sqrt{H/n}}\sim t(n)\\[10pt] \overline{X}-\overline{Y}\sim N\left(\mu_1 - \mu_2, \sigma^2\left(\dfrac{1}{n_1}+\dfrac{1}{n_2}\right)\right)\\[10pt]

其中

Z=XY(μ1μ2)σ1n1+1n2N(0,1)H=(n11)S12+(n21)S22σ2χ2(n1+n22)Z=\frac{\overline{X}-\overline{Y}-(\mu_1 - \mu_2)}{\sigma\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}}\sim N(0,1)\\[10pt] H=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{\sigma^2}\sim \chi^2(n_1+n_2-2)\\[10pt]

对于样本方差 S12S_1^2S22S_2^2 ,有:

S12/σ12S22/σ22F(n11,n22)\dfrac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1, n_2-2)

两个独立正态总体参数的区间估计#

已知总体方差 σ12σ22\sigma_1^2,\sigma_2^2 时总体均值差 μ1μ2\mu_1 - \mu_2 的置信区间#

用标准正态分布的那个式子:

Z=XY(μ1μ2)σ12n1+σ22n2N(0,1)P(c<Z<d)=1αZ=\frac{\overline{X}-\overline{Y}-(\mu_1 - \mu_2)}{\sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}}\sim N(0,1)\\[10pt] P(c < Z < d) = 1 - \alpha

根据标准正态分布的对称性,有:

P(u1α/2<Z<u1α/2)=1αP\left(-u_{1-\alpha/2} < Z < u_{1-\alpha/2}\right) = 1 - \alpha

解不等式:

P(XYu1α/2σ12n1+σ22n2<μ1μ2<XY+u1α/2σ12n1+σ22n2)=1αP\left(\overline{X}-\overline{Y} - u_{1-\alpha/2} \sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}} < \mu_1 - \mu_2 < \overline{X}-\overline{Y} + u_{1-\alpha/2} \sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}\right) = 1 - \alpha

所以,μ1μ2\mu_1 - \mu_2 置信度为 1α1-\alpha 的置信区间为:

(XYu1α/2σ12n1+σ22n2,  XY+u1α/2σ12n1+σ22n2)\left(\overline{X}-\overline{Y} - u_{1-\alpha/2} \sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}, \; \overline{X}-\overline{Y} + u_{1-\alpha/2} \sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}\right)

已知总体方差 σ12=σ22\sigma_1^2=\sigma_2^2 时(不知道具体值)总体均值差 μ1μ2\mu_1 - \mu_2 的置信区间#

用t分布的那个式子:

T=XY(μ1μ2)Sw1n1+1n2t(n1+n22)P(c<T<d)=1αT=\frac{\overline{X}-\overline{Y}-(\mu_1 - \mu_2)}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}}\sim t(n_1+n_2-2)\\[10pt] P(c < T < d) = 1 - \alpha

根据t分布的对称性,有:

P(t1α/2(n1+n22)<T<t1α/2(n1+n22))=1αP\left(-t_{1-\alpha/2}(n_1+n_2-2) < T < t_{1-\alpha/2}(n_1+n_2-2)\right) = 1 - \alpha

解不等式:

P(XYt1α/2(n1+n22)Sw1n1+1n2<μ1μ2<XY+t1α/2(n1+n22)Sw1n1+1n2)=1αP\left(\overline{X}-\overline{Y} - t_{1-\alpha/2}(n_1+n_2-2) S_w \sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}} < \mu_1 - \mu_2 < \overline{X}-\overline{Y} + t_{1-\alpha/2}(n_1+n_2-2) S_w \sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}\right) = 1 - \alpha

所以,μ1μ2\mu_1 - \mu_2 置信度为 1α1-\alpha 的置信区间为:

(XYt1α/2(n1+n22)Sw1n1+1n2,  XY+t1α/2(n1+n22)Sw1n1+1n2)\left(\overline{X}-\overline{Y} - t_{1-\alpha/2}(n_1+n_2-2) S_w \sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}, \; \overline{X}-\overline{Y} + t_{1-\alpha/2}(n_1+n_2-2) S_w \sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}\right)

已知总体方差比 σ12/σ22=c\sigma_1^2/\sigma_2^2=c 时总体均值差的置信区间#

和t分布的那个类似,只不过多了系数c

求总体方差比 σ12/σ22\sigma_1^2/\sigma_2^2 的置信区间#

用F分布的那个式子:

F=S12/σ12S22/σ22F(n11,n22)P(c<F<d)=1αF=\dfrac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1, n_2-2)\\[10pt] P(c < F < d) = 1 - \alpha

根据F分布的不对称性,有:

P(Fα/2(n11,n22)<F<F1α/2(n11,n22))=1αP\left(F_{\alpha/2}(n_1-1, n_2-2) < F < F_{1-\alpha/2}(n_1-1, n_2-2)\right) = 1 - \alpha

解不等式:

P(S12S221F1α/2(n11,n22)<σ12σ22<S12S221Fα/2(n11,n22))=1αP\left(\frac{S_1^2}{S_2^2} \cdot \frac{1}{F_{1-\alpha/2}(n_1-1, n_2-2)} < \frac{\sigma_1^2}{\sigma_2^2} < \frac{S_1^2}{S_2^2} \cdot \frac{1}{F_{\alpha/2}(n_1-1, n_2-2)}\right) = 1 - \alpha

所以,σ12/σ22\sigma_1^2/\sigma_2^2 置信度为 1α1-\alpha 的置信区间为:

(S12S221F1α/2(n11,n22),  S12S221Fα/2(n11,n22))\left(\frac{S_1^2}{S_2^2} \cdot \frac{1}{F_{1-\alpha/2}(n_1-1, n_2-2)}, \; \frac{S_1^2}{S_2^2} \cdot \frac{1}{F_{\alpha/2}(n_1-1, n_2-2)}\right)
TIP

可能用到的F分布性质:

1Fα(m,n)=F1α(n,m)\frac{1}{F_{\alpha}(m,n)} = F_{1-\alpha}(n,m)
区间估计:单个及两个正态总体参数估计
https://biscuit0613.github.io/posts/possibilitytheory/pt_areaestimate/
作者
Biscuit
发布于
2025-12-09
许可协议
CC BY-NC-SA 4.0