参数估计

设有一个统计总体,总体的分布函数为 F(x,θ)F(x,\theta),其中 θ\theta 为未知参数。现从该总体取样本 X1,X2,,XnX_1,X_2,\cdots,X_n,要依据样本对参数 θ\theta 作出估计,或估计 θ\theta 的某个已知函数 g(θ)g(\theta)。这类问题称为参数估计

点估计

由样本 X1,X2,,XnX_1,X_2,\cdots,X_n 确定一个统计量 θ^=θ(X1,X2,,Xn)\hat{\theta} = \theta(X_1,X_2,\cdots,X_n) 用它估计总体的未知参数 θ\theta,称为总体参数的估计量。当具体的样本抽出后,可求出样本统计量的值 θ^=θ(x1,x2,,xn)\hat{\theta} = \theta(x_1,x_2,\cdots,x_n) 用它作为总体参数的估计值,称为总体参数的点估计值

矩估计

统计思想:用样本矩估计总体矩,用样本矩函数估计总体矩函数。

理论依据:大数定律

估计步骤:设总体有 mm 个未知参数 θ1,θ2,,θm\theta_1,\theta_2,\cdots,\theta_m,假定总体 XX 的前 mm 阶矩都存在。X1,X2,,XnX_1,X_2,\cdots,X_n 是来自总体的样本。

  1. 求出总体 XX 的前 mm 阶原点矩

    {α1=E(X)=q1(θ1,θ2,,θm)α2=E(X2)=D(X)+E2(X)=q2(θ1,θ2,,θm)αm=E(Xm)=qm(θ1,θ2,,θm)\begin{cases} \alpha_1 = E(X) = q_1(\theta_1,\theta_2,\cdots,\theta_m) \\ \alpha_2 = E(X^2) = D(X) + E^2(X) = q_2(\theta_1,\theta_2,\cdots,\theta_m) \\ \vdots \\ \alpha_m = E(X^m) = q_m(\theta_1,\theta_2,\cdots,\theta_m) \end{cases}

  2. 解上面矩方程组,把未知参数用原点矩表示

    {θ1=h1(α1,α2,,αm)θ2=h2(α1,α2,,αm)θm=hm(α1,α2,,αm)\begin{cases} \theta_1 = h_1(\alpha_1,\alpha_2,\cdots,\alpha_m) \\ \theta_2 = h_2(\alpha_1,\alpha_2,\cdots,\alpha_m) \\ \vdots \\ \theta_m = h_m(\alpha_1,\alpha_2,\cdots,\alpha_m) \end{cases}

  3. 用样本各阶原点矩 A1,A2,,AmA_1,A_2,\cdots,A_m 代替总体各阶原点矩 α1,α2,,αm\alpha_1,\alpha_2,\cdots,\alpha_m,得到各参数的矩估计

    θ^k=hk(A1,A2,,Am)\hat{\theta}_k = h_k(A_1,A_2,\cdots,A_m)k=1,2,,mk=1,2,\cdots,m),其中 Ak=1ni=1nXikA_k = \frac{1}{n}\sum\limits_{i=1}^n X_i^k

最大似然估计

统计思想:选择一组参数使得实验结果具有最大概率

离散型总体的似然函数

设离散型总体 XX 的分布列为

P(X=x)=p(x;θ1,,θm)P(X=x) = p(x;\theta_1,\cdots,\theta_m)

θ1,,θm\theta_1,\cdots,\theta_m 为未知参数,X1,,XnX_1,\cdots,X_n 为样本,其观察值为 x1,,xnx_1,\cdots,x_n,观察值 (X1=x1,,Xn=xn)(X_1=x_1,\cdots,X_n=x_n) 出现的概率为

L(θ1,,θm)=P{X1=x1,,Xn=xn}=i=1np(xi;θ1,,θm)L(\theta_1,\cdots,\theta_m) = P\{X_1=x_1,\cdots,X_n=x_n \} = \prod\limits_{i=1}^n p(x_i;\theta_1,\cdots,\theta_m)

称之为似然函数

连续型总体的似然函数

设连续型总体 XX 的概率密度为 f(x;θ1,,θm)f(x;\theta_1,\cdots,\theta_m)θ1,,θm\theta_1,\cdots,\theta_m 是未知参数,X1,,XnX_1,\cdots,X_n 为样本,其观察值为 x1,,xnx_1,\cdots,x_n,样本 X1,,XnX_1,\cdots,X_n 的联合概率密度

L(θ1,,θm)=f(x1,,xm)=i=1nf(xi;θ1,,θm)L(\theta_1,\cdots,\theta_m) = f(x_1,\cdots,x_m) = \prod\limits_{i=1}^n f(x_i;\theta_1,\cdots,\theta_m)

称之为似然函数

最大似然估计

若统计量 θ^1(X1,,Xn),,θ^m(X1,,Xn)\hat{\theta}_1(X_1,\cdots,X_n),\cdots,\hat{\theta}_m(X_1,\cdots,X_n) 使得

L(θ^1,,θ^m)=maxθ1,,θmL(θ1,,θm)L(\hat{\theta}_1,\cdots,\hat{\theta}_m) = \max\limits_{\theta_1,\cdots,\theta_m}L(\theta_1,\cdots,\theta_m)

则称 θ^1(X1,,Xn),,θ^m(X1,,Xn)\hat{\theta}_1(X_1,\cdots,X_n),\cdots,\hat{\theta}_m(X_1,\cdots,X_n)θ1,,θm\theta_1,\cdots,\theta_m最大似然估计量θ^i(x1,,xn)\hat{\theta}_i(x_1,\cdots,x_n)i=1,2,,mi=1,2,\cdots,mθi\theta_i最大似然估计值

估计步骤

  1. 写出似然函数

    L=L(θ1,θ2,,θm)=L(x1,x2,,xn;θ1,θ2,,θm)L = L(\theta_1,\theta_2,\cdots,\theta_m) = L(x_1,x_2,\cdots,x_n;\theta_1,\theta_2,\cdots,\theta_m)

  2. 对似然函数取对数

    lnL={i=1nlnf(xi;θ1,,θm)连续总体i=1nlnP(Xi=xi;θi,,θm)离散总体\ln{L} = \begin{cases} \sum\limits_{i=1}^n \ln{f}(x_i;\theta_1,\cdots,\theta_m) & 连续总体 \\ \sum\limits_{i=1}^n \ln{P}(X_i=x_i;\theta_i,\cdots,\theta_m) & 离散总体 \end{cases}

  3. 建立似然方程

    lnL(θ1,,θm)θj=0(j=1,,m)\frac{\partial \ln L(\theta_1,\cdots,\theta_m)}{\partial\theta_j} = 0 \quad (j=1,\cdots,m)

  4. 解似然方程,即可求出参数 θj\theta_j 的最大似然估计。若似然函数不可微,用定义求。

区间估计

定义1:设总体 XX 的分布函数为 F(x,θ)F(x,\theta)θ\theta 是未知参数,对给定 α\alpha0<α<10<\alpha<1),由样本 X1,,XnX_1,\cdots,X_n 确定两个统计量

θ^1=θ^1(X1,,Xn)θ^2=θ^2(X1,,Xn)\hat{\theta}_1 = \hat{\theta}_1(X_1,\cdots,X_n)\quad 和 \quad \hat{\theta}_2=\hat{\theta}_2(X_1,\cdots,X_n)

使得

P(θ^1<θ<θ^2)1αP(\hat{\theta}_1<\theta < \hat{\theta}_2) \ge 1 - \alpha

(θ^1,θ^2)(\hat{\theta}_1,\hat{\theta}_2)θ\theta 置信度为 1α1-\alpha置信区间θ^1\hat{\theta}_1θ^2\hat{\theta}_2 分别称为置信下限置信上限

定义2:设总体 XX 的分布函数为 F(x,θ)F(x,\theta)θ\theta 是未知参数,对给定 α\alpha0<α<10<\alpha<1),由样本 X1,,XnX_1,\cdots,X_n 确定的统计量 θ^L=θ^L(X1,,Xn)\hat{\theta}_L = \hat{\theta}_L(X_1,\cdots,X_n) 满足

P(θ>θ^L)1αP(\theta>\hat{\theta}_L) \ge 1 - \alpha

θ^L\hat{\theta}_Lθ\theta 的置信度为 1α1-\alpha单侧置信下限

若由样本确定的统计量 θ^U=θ^U(X1,,Xn)\hat{\theta}_U=\hat{\theta}_U(X_1,\cdots,X_n) 满足

P(θ<θ^U)1αP(\theta < \hat{\theta}_U) \ge 1 - \alpha

θ^U\hat{\theta}_Uθ\theta 的置信度为 1α1-\alpha单侧置信上限

估计步骤

  1. θ\theta 的一个点估计 θ^\hat{\theta} 出发,构造 θ^\hat{\theta}θ\theta 的一个函数 G(θ^,θ)G(\hat{\theta},\theta),使得 GG 的分布已知且与 θ\theta 无关。通常称函数 G(θ^,θ)G(\hat{\theta},\theta)枢轴量

  2. 对给定的 α\alpha,根据 GG 的分布找两个临界值 ccdd,使得

    P(c<G(θ^,θ)<d)=1αP(c<G(\hat{\theta},\theta)<d)=1-\alpha

  3. c<G(θ^,θ)<dc<G(\hat{\theta},\theta)<d 解出 θ^1<θ<θ^2\hat{\theta}_1<\theta<\hat{\theta}_2θ^1,θ^2\hat{\theta}_1,\hat{\theta}_2θ\theta 置信度为 1α1-\alpha置信区间

单个正态总体参数的区间估计

设总体 XN(μ,σ2)X\sim N(\mu,\sigma^2)X1,X2,,XnX_1,X_2,\cdots,X_n 为总体 XX 的样本,X\overline{X}S2S^2 分别为样本均值,样本方差,置信度为 1α1-\alpha

σ\sigma 已知,求 μ\mu 的置信区间

取枢轴量 u=Xμσ/nN(0,1)u=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)

P(uα2<Xμσ/n<uα2)=1αP\left(-u_{\frac{\alpha}{2}}<\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}<u_{\frac{\alpha}{2}}\right) = 1-\alpha

解得 μ\mu 的置信度为 1α1-\alpha 的置信区间为

(Xuα2αn,X+uα2αn)\left(\overline{X}-u_{\frac{\alpha}{2}}\frac{\alpha}{\sqrt{n}}, \overline{X}+u_{\frac{\alpha}{2}}\frac{\alpha}{\sqrt{n}}\right)

同理可得:

μ\mu 的置信度为 1α1-\alpha 单侧置信下限为 Xuααn\overline{X}-u_{\alpha}\frac{\alpha}{\sqrt{n}}

μ\mu 的置信度为 1α1-\alpha 单侧置信上限为 X+uααn\overline{X}+u_{\alpha}\frac{\alpha}{\sqrt{n}}

σ\sigma 未知,求 μ\mu 的置信区间

取枢轴量 t=XμS/nt(n1)t=\frac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1)

P(tα2(n1)<XμS/n<tα2(n1))=1αP\left(-t_{\frac{\alpha}{2}}(n-1) <\frac{\overline{X}-\mu}{S/\sqrt{n}}<t_{\frac{\alpha}{2}}(n-1) \right) = 1-\alpha

解得 μ\mu 的置信度为 1α1-\alpha 的置信区间为

(Xtα2(n1)Sn,X+tα2(n1)Sn)\left(\overline{X}-t_{\frac{\alpha}{2}}(n-1) \frac{S}{\sqrt{n}}, \overline{X}+t_{\frac{\alpha}{2}}(n-1) \frac{S}{\sqrt{n}}\right)

同理可得:

μ\mu 的置信度为 1α1-\alpha 单侧置信下限为 Xtα(n1)Sn\overline{X}-t_{\alpha}(n-1) \frac{S}{\sqrt{n}}

μ\mu 的置信度为 1α1-\alpha 单侧置信上限为 X+tα(n1)Sn\overline{X}+t_{\alpha}(n-1) \frac{S}{\sqrt{n}}

σ2\sigma^2 的置信区间

取枢轴量 χ2=(n1)S2σ2χ2(n1)\chi^2 = \frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1)

P(χ1α22(n1)<(n1)S2σ2<χα22(n1))=1αP\left(\chi^2_{1-\frac{\alpha}{2}}(n-1)<\frac{(n-1)S^2}{\sigma^2}<\chi^2_{\frac{\alpha}{2}}(n-1) \right) = 1-\alpha

解得 σ2\sigma^2 的置信度为 1α1-\alpha 的置信区间为

((n1)S2χα22(n1),(n1)S2χ1α22(n1))\left(\frac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)}, \frac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}\right)

同理可得:

σ2\sigma^2 的置信度为 1α1-\alpha 单侧置信下限为 (n1)S2χα2(n1)\frac{(n-1)S^2}{\chi^2_{\alpha}(n-1)}

σ2\sigma^2 的置信度为 1α1-\alpha 单侧置信上限为 (n1)S2χ1α2(n1)\frac{(n-1)S^2}{\chi^2_{1-\alpha}(n-1)}

两个正态总体参数的估计

σ12,σ22\sigma_1^2,\sigma_2^2 均已知,求 μ1μ2\mu_1-\mu_2 的置信区间

XYN(μ1μ2,σ12n1+σ22n2)\overline{X}-\overline{Y} \sim N(\mu_1-\mu_2,\frac{\sigma^2_1}{n_1}+\frac{\sigma_2^2}{n_2})

取枢轴量 u=(XY)(μ1μ2)σ12n1+σ22n2N(0,1)u=\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma^2_1}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1)

σ12=σ22=σ2\sigma_1^2=\sigma_2^2=\sigma^2,但 σ2\sigma^2 未知,求 μ1μ2\mu_1-\mu_2 的置信区间

Sw2=(n11)S12+(n21)S22n1+n22S^2_w = \frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} 代替 σ2\sigma^2 的枢轴量

t=(XY)(μ1μ2)Sw1n1+1n2t(n1+n22)t=\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2)

σ12σ22\frac{\sigma_1^2}{\sigma_2^2} 的置信区间

选枢轴量 F=S12/S22σ12/σ22F(n11,n21)F = \frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2}\sim F(n_1-1,n_2-1)