参数估计
设有一个统计总体,总体的分布函数为 F(x,θ),其中 θ 为未知参数。现从该总体取样本 X1,X2,⋯,Xn,要依据样本对参数 θ 作出估计,或估计 θ 的某个已知函数 g(θ)。这类问题称为参数估计。
点估计
由样本 X1,X2,⋯,Xn 确定一个统计量 θ^=θ(X1,X2,⋯,Xn) 用它估计总体的未知参数 θ,称为总体参数的估计量。当具体的样本抽出后,可求出样本统计量的值 θ^=θ(x1,x2,⋯,xn) 用它作为总体参数的估计值,称为总体参数的点估计值。
矩估计
统计思想:用样本矩估计总体矩,用样本矩函数估计总体矩函数。
理论依据:大数定律
估计步骤:设总体有 m 个未知参数 θ1,θ2,⋯,θm,假定总体 X 的前 m 阶矩都存在。X1,X2,⋯,Xn 是来自总体的样本。
-
求出总体 X 的前 m 阶原点矩
⎩⎨⎧α1=E(X)=q1(θ1,θ2,⋯,θm)α2=E(X2)=D(X)+E2(X)=q2(θ1,θ2,⋯,θm)⋮αm=E(Xm)=qm(θ1,θ2,⋯,θm)
-
解上面矩方程组,把未知参数用原点矩表示
⎩⎨⎧θ1=h1(α1,α2,⋯,αm)θ2=h2(α1,α2,⋯,αm)⋮θm=hm(α1,α2,⋯,αm)
-
用样本各阶原点矩 A1,A2,⋯,Am 代替总体各阶原点矩 α1,α2,⋯,αm,得到各参数的矩估计
θ^k=hk(A1,A2,⋯,Am)(k=1,2,⋯,m),其中 Ak=n1i=1∑nXik
最大似然估计
统计思想:选择一组参数使得实验结果具有最大概率
离散型总体的似然函数
设离散型总体 X 的分布列为
P(X=x)=p(x;θ1,⋯,θm)
θ1,⋯,θm 为未知参数,X1,⋯,Xn 为样本,其观察值为 x1,⋯,xn,观察值 (X1=x1,⋯,Xn=xn) 出现的概率为
L(θ1,⋯,θm)=P{X1=x1,⋯,Xn=xn}=i=1∏np(xi;θ1,⋯,θm)
称之为似然函数。
连续型总体的似然函数
设连续型总体 X 的概率密度为 f(x;θ1,⋯,θm),θ1,⋯,θm 是未知参数,X1,⋯,Xn 为样本,其观察值为 x1,⋯,xn,样本 X1,⋯,Xn 的联合概率密度
L(θ1,⋯,θm)=f(x1,⋯,xm)=i=1∏nf(xi;θ1,⋯,θm)
称之为似然函数。
最大似然估计
若统计量 θ^1(X1,⋯,Xn),⋯,θ^m(X1,⋯,Xn) 使得
L(θ^1,⋯,θ^m)=θ1,⋯,θmmaxL(θ1,⋯,θm)
则称 θ^1(X1,⋯,Xn),⋯,θ^m(X1,⋯,Xn) 为 θ1,⋯,θm 的最大似然估计量。θ^i(x1,⋯,xn),i=1,2,⋯,m 为 θi 的最大似然估计值。
估计步骤:
-
写出似然函数
L=L(θ1,θ2,⋯,θm)=L(x1,x2,⋯,xn;θ1,θ2,⋯,θm)
-
对似然函数取对数
lnL=⎩⎨⎧i=1∑nlnf(xi;θ1,⋯,θm)i=1∑nlnP(Xi=xi;θi,⋯,θm)连续总体离散总体
-
建立似然方程
∂θj∂lnL(θ1,⋯,θm)=0(j=1,⋯,m)
-
解似然方程,即可求出参数 θj 的最大似然估计。若似然函数不可微,用定义求。
区间估计
定义1:设总体 X 的分布函数为 F(x,θ),θ 是未知参数,对给定 α(0<α<1),由样本 X1,⋯,Xn 确定两个统计量
θ^1=θ^1(X1,⋯,Xn)和θ^2=θ^2(X1,⋯,Xn)
使得
P(θ^1<θ<θ^2)≥1−α
称 (θ^1,θ^2) 为 θ 置信度为 1−α 的置信区间,θ^1 和 θ^2 分别称为置信下限和置信上限。
定义2:设总体 X 的分布函数为 F(x,θ),θ 是未知参数,对给定 α(0<α<1),由样本 X1,⋯,Xn 确定的统计量 θ^L=θ^L(X1,⋯,Xn) 满足
P(θ>θ^L)≥1−α
称 θ^L 为 θ 的置信度为 1−α 的单侧置信下限。
若由样本确定的统计量 θ^U=θ^U(X1,⋯,Xn) 满足
P(θ<θ^U)≥1−α
称 θ^U 为 θ 的置信度为 1−α 的单侧置信上限。
估计步骤:
-
从 θ 的一个点估计 θ^ 出发,构造 θ^ 与 θ 的一个函数 G(θ^,θ),使得 G 的分布已知且与 θ 无关。通常称函数 G(θ^,θ) 为枢轴量
-
对给定的 α,根据 G 的分布找两个临界值 c 和 d,使得
P(c<G(θ^,θ)<d)=1−α
-
从 c<G(θ^,θ)<d 解出 θ^1<θ<θ^2。θ^1,θ^2 为 θ 置信度为 1−α 的置信区间
单个正态总体参数的区间估计
设总体 X∼N(μ,σ2),X1,X2,⋯,Xn 为总体 X 的样本,X,S2 分别为样本均值,样本方差,置信度为 1−α
σ 已知,求 μ 的置信区间
取枢轴量 u=σ/nX−μ∼N(0,1)
则
P(−u2α<σ/nX−μ<u2α)=1−α
解得 μ 的置信度为 1−α 的置信区间为
(X−u2αnα,X+u2αnα)
同理可得:
μ 的置信度为 1−α 单侧置信下限为 X−uαnα
μ 的置信度为 1−α 单侧置信上限为 X+uαnα
σ 未知,求 μ 的置信区间
取枢轴量 t=S/nX−μ∼t(n−1)
则
P(−t2α(n−1)<S/nX−μ<t2α(n−1))=1−α
解得 μ 的置信度为 1−α 的置信区间为
(X−t2α(n−1)nS,X+t2α(n−1)nS)
同理可得:
μ 的置信度为 1−α 单侧置信下限为 X−tα(n−1)nS
μ 的置信度为 1−α 单侧置信上限为 X+tα(n−1)nS
求 σ2 的置信区间
取枢轴量 χ2=σ2(n−1)S2∼χ2(n−1)
则
P(χ1−2α2(n−1)<σ2(n−1)S2<χ2α2(n−1))=1−α
解得 σ2 的置信度为 1−α 的置信区间为
(χ2α2(n−1)(n−1)S2,χ1−2α2(n−1)(n−1)S2)
同理可得:
σ2 的置信度为 1−α 单侧置信下限为 χα2(n−1)(n−1)S2
σ2 的置信度为 1−α 单侧置信上限为 χ1−α2(n−1)(n−1)S2
两个正态总体参数的估计
σ12,σ22 均已知,求 μ1−μ2 的置信区间
X−Y∼N(μ1−μ2,n1σ12+n2σ22)
取枢轴量 u=n1σ12+n2σ22(X−Y)−(μ1−μ2)∼N(0,1)
σ12=σ22=σ2,但 σ2 未知,求 μ1−μ2 的置信区间
用 Sw2=n1+n2−2(n1−1)S12+(n2−1)S22 代替 σ2 的枢轴量
t=Swn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2)
σ22σ12 的置信区间
选枢轴量 F=σ12/σ22S12/S22∼F(n1−1,n2−1)