数理统计
数理统计是以概率论为理论基础,研究怎样用有效的方法去收集、整理、分析带随机影响的数据,以便对所研究的问题给出估计和推断,为决策提供依据和建议。
总体和个体
根据总体中个体的数目是否有限可以把总体分为有限总体和无限总体。
样本
- 样本:按一定规则从总体中抽取的一部分个体。
- 样本容量:样本中所含个体的数目。
- 抽样:抽取样本的过程。
简单随机样本
若 X1,X2,⋯,Xn 相互独立且与总体 X 有相同的分布,则称 X1,X2,⋯,Xn 为来自总体 X 的一个容量为 n 的简单随机样本,简称为 X 的一个样本。获得简单随机样本的抽样称为简单随机抽样。
样本 (X1,X2,⋯,Xn) 的每一个观察值 (x1,x2,⋯,xn) 称为样本值或样本的一次实现。
样本值的集合称为样本空间。
三大分布
χ2 分布
设 X1,X2,⋯,Xn 相互独立,都服从标准正态分布 N(0,1),则称随机变量
Y=i=1∑nXi2
服从自由度为 n 的 χ2 分布,记为 Y∼χ2(n)
χ2 分布的性质
- 设 X∼χ2(n),则 E(X)=n,D(X)=2n
- 设 X1,X2,⋯,Xm 独立,且 Xi∼χ2(ni),则 i=1∑mXi∼χ2(i=1∑mni)
χ2 分布的上侧 α 分位数或临界值
设 α(0<α<1),称满足等式 P(X≥χα2(n))=α 的点 χα2(n) 为 χ2(n) 分布的上侧 α 分位数或临界值。
t 分布
设 X,Y 相互独立,且 X∼N(0,1),Y∼χ2(n),则称随机变量
T=nYX
服从自由度为 n 的 t 分布,记为 T∼t(n)
t 分布的上侧 α 分位数或临界值
设 α(0<α<1),称满足等式 P(T≥tα(n))=α 的点 tα(n) 为 t(n) 分布的上侧 α 分位数或临界值。
F 分布
设 X,Y 相互独立,X∼χ2(n1),Y∼χ2(n2),则称随机变量
F=Y/n2X/n1
服从第一自由度为 n1,第二自由度为 n2 的 F 分布,记为 F∼F(n1,n2)
F 分布的上侧 α 分位数或临界值
设 α(0<α<1),称满足等式 P(F≥Fα(n1,n2))=α 的点 Fα(n1,n2) 为 F(n1,n2) 分布的上侧 α 分位数或临界值。
统计量
设 X1,X2,⋯,Xn 为总体 X 的容量为 n 的样本,T(X1,X2,⋯,Xn) 是定义在样本空间上,不含未知参数的连续函数,则称 T(X1,X2,⋯,Xn) 为一个统计量。
常用统计量
-
样本均值:X=n1i=1∑nXi
-
样本方差:S2=n−11i=1∑n(Xi−X)2
-
样本标准差:S=n−11i=1∑n(Xi−X)2
-
样本 k 阶原点矩:Ak=n1i=1∑nXik
-
样本 k 阶中心原点矩:Bk=n1i=1∑n(Xi−X)k
-
顺序统计量:设 X1,X2,⋯,Xn 为总体 X 的一个样本,X1,X2,⋯,xn 是样本值,将它们按大小次序排列,得
x(1)≤x(2)≤⋯≤x(n)
称 X(i) 为第 i 个顺序统计量,如果不论样本 X1,X2,⋯,Xn 取哪组观测值 x1,x2,⋯,xn,X(i) 总是取 x(i) 为观测值,即
X(1)≤X(2)≤⋯≤X(n)
特别的,称 X(1) 为最小顺序统计量,X(n) 为最大顺序统计量。
-
样本中位数
M={X(2n+1)21[X(2n)+X(2n+1)]n为奇数n为偶数
-
样本极差:R=X(n)−X(1)
抽样分布
当用统计量推断总体时,必须知道统计量的分布,统计量的分布属于样本函数的分布,人们把样本函数的分布统称为抽样分布。
单个正态总体统计量的分布
样本均值的分布
设 X1,X2,⋯,Xn 为总体 N(μ,σ2) 的一个样本,样本均值 X=n1i=1∑nXi,则
X∼N(μ,nσ2)
样本方差的分布
设 X1,X2,⋯,Xn 为总体 N(μ,σ2) 的一个样本,样本方差 S2=n−11i=1∑n(Xi−X)2,则
- 样本方差 S2 与样本均值 X 相互独立;
- σ2(n−1)S2∼χ2(n−1)
定理3
设 X1,X2,⋯,Xn 为总体 N(μ,σ2) 的一个样本,X 和 S2 分别为样本均值和样本方差,则
Sn(X−μ)∼t(n−1)
两个正态总体统计量的分布
定理4
设 X1,X2,⋯,Xn1 和 Y1,Y2,⋯,Yn2 分别是来自总体 N(μ1,σ12) 和 N(μ2,σ22) 的两个样本,它们相互独立,样本均值分别为 X 和 Y,样本方差分别为 S12 和 S22,则
S22/σ22S12/σ12∼F(n1−1,n2−1)
当 σ12=σ22=σ2 时
Swn11+n21X−Y−(μ1−μ2)∼t(n1+n2−2)
其中
Sw=n1+n2−2(n1−1)S12+(n2−1)S22