目的:给出估计参数的一个区间,而不是一个点。
点估计产生的是一个点,尽管可以通过估计量的检验来判断其有效性,但无法反映估计值的精确程度。而区间估计通过提供一个区间,可以更好地反映估计值的不确定性。
理论依据:正态总体下统计量的分布#
在正态总体下,样本均值和样本方差的分布性质为区间估计提供了理论基础。
Z=σ/nX−μσ2(n−1)S2S2/nX−μ∼N(0,1)∼χ2(n−1)∼t(n−1)
置信区间的构造#
对于一个来自参数空间 H 的参数 θ ,x1⋯xi 为来自总体的样本。给定一个数 α ,α 取0.01,0.05,0.1等常用值。
有两个统计量:θ^U(x1⋯xi) 和 θ^L(x1⋯xi)。若对任意 θ∈H ,都有
P(θ^L<θ<θ^U)≥1−α则称区间 (θ^L,θ^U) 为参数 θ 的置信区间,置信度为 1−α 。
计算置信区间:枢轴量法#
构造一个和样本,参数有关的函数 G(x1,…,xn;θ),满足:
-
G 的分布不依赖于参数 θ 。
-
G 关于 θ 单调递增或递减。
-
已知 G 的分布,可以求出其分位点。
称 G 为枢轴量。
这里以正态总体参数的置信区间为例:(主要考这一块)
已知总体方差 σ2 时总体均值 μ 的置信区间#
已知总体方差 σ2 时,样本均值的标准化变量作为枢轴量:
G=σ/nX−μ∼N(0,1)P(c<G<d)=1−α根据标准正态分布的对称性,有:
P(−u1−α/2<G<u1−α/2)=1−αu 可以查表或者题目给,这里面只有 μ 是未知的,解不等式:
P(X−u1−α/2nσ<μ<X+u1−α/2nσ)=1−α所以,μ 置信度为 1−α 的置信区间为:
(X−u1−α/2nσ,X+u1−α/2nσ)记住就行了喵。
未知总体方差 σ2 时总体均值 μ 的置信区间#
总体方差未知时,用样本方差作为无偏估计,用含t分布的那个式子:
G=S2/nX−μ∼t(n−1)P(c<G<d)=1−α根据t分布的对称性,有:
P(−t1−α/2(n−1)<G<t1−α/2(n−1))=1−α解不等式:
P(X−t1−α/2(n−1)nS<μ<X+t1−α/2(n−1)nS)=1−α所以,μ 置信度为 1−α 的置信区间为:
(X−t1−α/2(n−1)nS,X+t1−α/2(n−1)nS)总体方差 σ2 的置信区间#
一般来说不会有 μ 已知 σ2 未知的情况,所以直接看 σ2 的置信区间。(默认 μ 是未知的)
所以这时候用不含有 μ 的那个式子:
G=σ2(n−1)S2∼χ2(n−1)P(c<G<d)=1−α注意卡方分布不对称:
P(χα/22(n−1)<G<χ1−α/22(n−1))=1−α解不等式:
P(χ1−α/22(n−1)(n−1)S2<σ2<χα/22(n−1)(n−1)S2)=1−α所以,σ2 置信度为 1−α 的置信区间为:
(χ1−α/22(n−1)(n−1)S2,χα/22(n−1)(n−1)S2)记住就行了喵。
两个独立正态总体统计量的分布#
两个独立的正态总体 X∼N(μ1,σ12) 和 Y∼N(μ2,σ22)
对于X(或Y)每一个样本均值和方差:
XYσ12(n1−1)S12σ22(n2−1)S22∼N(μ1,n1σ12)∼N(μ2,n2σ22)∼χ2(n1−1)∼χ2(n2−1)如果 σ12=σ22=σ2,则有:
Swn11+n21X−Y−(μ1−μ2)∼t(n1+n2−2)其中Sw2=n1+n2−2(n1−1)S12+(n2−1)S22利用了t分布的定义构造,上面是 X−Y 标准化,下面的卡方分布利用X,Y样本方差和卡方分布的可加性构造。
推导,在已知 σ12=σ22=σ2 时:
T=H/nZ∼t(n)X−Y∼N(μ1−μ2,σ2(n11+n21))其中
Z=σn11+n21X−Y−(μ1−μ2)∼N(0,1)H=σ2(n1−1)S12+(n2−1)S22∼χ2(n1+n2−2)对于样本方差 S12 和 S22 ,有:
S22/σ22S12/σ12∼F(n1−1,n2−2)
两个独立正态总体参数的区间估计#
已知总体方差 σ12,σ22 时总体均值差 μ1−μ2 的置信区间#
用标准正态分布的那个式子:
Z=n1σ12+n2σ22X−Y−(μ1−μ2)∼N(0,1)P(c<Z<d)=1−α根据标准正态分布的对称性,有:
P(−u1−α/2<Z<u1−α/2)=1−α解不等式:
PX−Y−u1−α/2n1σ12+n2σ22<μ1−μ2<X−Y+u1−α/2n1σ12+n2σ22=1−α所以,μ1−μ2 置信度为 1−α 的置信区间为:
X−Y−u1−α/2n1σ12+n2σ22,X−Y+u1−α/2n1σ12+n2σ22已知总体方差 σ12=σ22 时(不知道具体值)总体均值差 μ1−μ2 的置信区间#
用t分布的那个式子:
T=Swn11+n21X−Y−(μ1−μ2)∼t(n1+n2−2)P(c<T<d)=1−α根据t分布的对称性,有:
P(−t1−α/2(n1+n2−2)<T<t1−α/2(n1+n2−2))=1−α解不等式:
P(X−Y−t1−α/2(n1+n2−2)Swn11+n21<μ1−μ2<X−Y+t1−α/2(n1+n2−2)Swn11+n21)=1−α所以,μ1−μ2 置信度为 1−α 的置信区间为:
(X−Y−t1−α/2(n1+n2−2)Swn11+n21,X−Y+t1−α/2(n1+n2−2)Swn11+n21)已知总体方差比 σ12/σ22=c 时总体均值差的置信区间#
和t分布的那个类似,只不过多了系数c
求总体方差比 σ12/σ22 的置信区间#
用F分布的那个式子:
F=S22/σ22S12/σ12∼F(n1−1,n2−2)P(c<F<d)=1−α根据F分布的不对称性,有:
P(Fα/2(n1−1,n2−2)<F<F1−α/2(n1−1,n2−2))=1−α解不等式:
P(S22S12⋅F1−α/2(n1−1,n2−2)1<σ22σ12<S22S12⋅Fα/2(n1−1,n2−2)1)=1−α所以,σ12/σ22 置信度为 1−α 的置信区间为:
(S22S12⋅F1−α/2(n1−1,n2−2)1,S22S12⋅Fα/2(n1−1,n2−2)1)TIP可能用到的F分布性质:
Fα(m,n)1=F1−α(n,m)