极大似然估计MLE#
一句话:找到使得样本出现的概率最大的参数值。
对于一个样本 X1,X2,…,Xn,假设它们来自于一个参数为 θ 的总体,其概率密度函数为 f(x;θ)。则样本的联合概率密度函数(或联合概率质量函数)为:
L(θ)=i=1∏nf(xi;θ)这个函数 L(θ) 被称为似然函数。这个越大,说明在参数 θ 下,观察到当前样本的可能性越大。
极大似然估计的目标是找到使得似然函数 L(θ) 最大化的参数值 θ^MLE,即:
θ^MLE=θargmaxL(θ)有时候求导发现不得0,就需要结合单调性取样本的特值。
对极大似然函数求导有时候不方便,可以对似然函数取对数,得到对数似然函数:
ℓ(θ)=lnL(θ)=i=1∑nlnf(Xi;θ)然后求偏导数并令其为零,解方程得到参数的估计值:
∂θ∂ℓ(θ)=0所以说重点还是在搞清楚样本的概率密度函数是啥。
NOTE这里的参数求偏导时应当被视为一个整体,例如,正态分布的参数是 (μ,σ2),应对 σ2 求偏导,而不是对 σ 求偏导。
正态分布的极大似然估计#
设样本 X1,X2,…,Xn 来自于一个正态分布 N(μ,σ2),其概率密度函数为:
f(x;μ,σ2)=2πσ21exp(−2σ2(x−μ)2)则样本的似然函数为:
L(μ,σ2)=i=1∏nf(Xi;μ,σ2)=(2πσ21)nexp(−2σ21i=1∑n(Xi−μ)2)对数似然函数为:(取ln)
ℓ(μ,σ2)=lnL(μ,σ2)=−2nln(2πσ2)−2σ21i=1∑n(Xi−μ)2对 μ 和 σ2 分别求偏导并令其为零:
∂μ∂ℓ∂σ2∂ℓ=σ21i=1∑n(Xi−μ)=0=−2σ2n+2(σ2)21i=1∑n(Xi−μ)2=0解得:
⎩⎨⎧μ^MLE=X=n1∑i=1nXiσ^MLE2=n1∑i=1n(Xi−X)2注意喵,这里的 σ^MLE2 和样本方差 S2 的定义是不一样的,样本方差的分母是 n−1,这里求出来的 σ^MLE2 的分母是 n,是样本的二阶中心距喵。
μ^ 就是样本的一阶原点矩,σ^2 是样本的二阶中心矩。这和矩估计法得到的结果是一致的喵。
均匀分布的极大似然估计#
设样本 X1,X2,…,Xn 来自于一个均匀分布 U(0,θ),其概率密度函数为:
f(x;θ)=⎩⎨⎧θ1,0,0≤x≤θotherwise则样本的似然函数为:
L(θ)=i=1∏nf(Xi;θ)=⎩⎨⎧θn1,0,0≤Xi≤θ for all iotherwise为了使似然函数 L(θ) 最大化,我们需要最大化 θn1,这等价于最小化 θ。由于所有样本 Xi 都必须小于等于 θ,因此 θ 的最小值为样本中的最大值:
θ^MLE=max(X1,X2,…,Xn)