欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

统计学基础4:矩估计

程序员文章站 2022-07-11 15:34:29
...
统计推断的基本问题
	参数估计
		点估计
		区间估计
	假设检验
	线性回归
	方差分析

参数通常是刻画总体某些概率特征的数量。
当该参数未知时,从总体中抽取一个样本,用某种方法对该参数进行估计,这就是参数估计。

假设总体XF(X;θ1,θ2,,θm)X\sim F(X;\theta_1,\theta_2,\dots,\theta_m),其中分布FF的表达式已知,但参数θ1,θ2,,θm\theta_1,\theta_2,\dots,\theta_m未知,若记θ=(θ1,θ2,,θm)\theta=(\theta_1,\theta_2,\dots,\theta_m),则总体分布可记为:
XF(X;θ)X\sim F(X;\theta)

参数的取值范围称为参数空间,记为Θ\Theta

点估计的思想

x1,x2,,xnx_1,x_2,\dots,x_n是来自总体XF(X;θ1,θ2,,θm)X\sim F(X;\theta_1,\theta_2,\dots,\theta_m)的一个样本,θ1,θ2,,θm\theta_1,\theta_2,\dots,\theta_m是未知参数。构造mm个统计量:
={θ^1(X1,X2,.Xn)θ^2(X1,X2,.Xn)θ^m(X1,X2,.Xn)随机变量=\begin{cases}\hat{\theta}_1(X_1,X_2,.\dots X_n) \\ \hat{\theta}_2(X_1,X_2,.\dots X_n) \\ \dots \\ \hat{\theta}_m(X_1,X_2,.\dots X_n)\end{cases}

当把样本观测值x1,x2,,xnx_1,x_2,\dots,x_n代入上统计量,就得到mm个数值:
={θ^1(x1,x2,,xn)θ^2(x1,x2,,xn)θ^m(x1,x2,,xn)数值=\begin{cases}\hat{\theta}_1(x_1,x_2,\dots,x_n) \\ \hat{\theta}_2(x_1,x_2,\dots,x_n) \\ \dots \\ \hat{\theta}_m(x_1,x_2,\dots,x_n)\end{cases}

θ^k(X1,X2,,Xn)\hat{\theta}_k(X_1,X_2,\dots,X_n)θ^k\hat{\theta}_k的估计量(k=1,2,,m)(k=1,2,\dots,m)
θ^k(x1,x2,,xn)\hat{\theta}_k(x_1,x_2,\dots,x_n)θ^k\hat{\theta}_k的估计值(k=1,2,,m)(k=1,2,\dots,m)

常用的点估计方法:

  • 矩估计法
  • 极大似然法
  • 最小二乘法
  • 贝叶斯方法

矩估计的思想

假设总体XF(X;θ1,θ2,,θm)X\sim F(X;\theta_1,\theta_2,\dots,\theta_m),参数θ1,θ2,,θm\theta_1,\theta_2,\dots,\theta_m未知,且总体的mm阶矩存在:
μk(θ1,θ2,,θm)=E(Xk)(k=1,2,,m)\mu_k(\theta_1,\theta_2,\dots,\theta_m)=E(X^k)\quad (k=1,2,\dots,m)

x1,x2,,xnx_1,x_2,\dots,x_n是来自总体XX的一个样本,则由辛钦大数定律,有:
Ak=1ni=1nxikPμk(θ1,θ2,,θm),nA_k=\frac{1}{n}\sum^{n}_{i=1}x_i^k\underrightarrow{P}\mu_k(\theta_1,\theta_2,\dots,\theta_m),\quad n\longrightarrow \infty

因此当nn较大时有
Ak=1ni=1nxikμk(θ1,θ2,,θm),(k=1,2,,m)A_k=\frac{1}{n}\sum^{n}_{i=1}x_i^k\approx\mu_k(\theta_1,\theta_2,\dots,\theta_m),(k=1,2,\dots,m)


{μ1(θ1,θ2,,θm)=A1μ2(θ1,θ2,,θm)=A2μm(θ1,θ2,,θm)=Am\begin{cases}\mu_1(\theta_1,\theta_2,\dots,\theta_m)=A_1\\\mu_2(\theta_1,\theta_2,\dots,\theta_m)=A_2\\ \dots\\ \mu_m(\theta_1,\theta_2,\dots,\theta_m)=A_m \end{cases}

用样本矩阶矩作为总体矩阶的估计量

其解θ^(x1,x2,,xn)\hat{\theta}(x_1,x_2,\dots,x_n)称为θ^\hat{\theta}的矩估计量,(k=1,2,,m).(k=1,2,\dots,m).

命题:不论总体XX服从什么分布,若其期望μ\mu和方差σ2\sigma^2都存在,则μ\muσ2\sigma^2的矩估计量分别为:
μ^=xˉ=1ni=1nXi,σ2^=1ni=1n(XiXˉ)2E(s2)\hat{\mu}=\bar{x}=\frac{1}{n}\sum^{n}_{i=1}X_i,\hat{\sigma^2}=\frac{1}{n}\sum^{n}_{i=1}(X_i-\bar{X})^2\equiv E(s^2)
E(s2)E(s^2)是修正的样本方差。
矩估计对均匀分布的参数估计不是很好。

矩估计小结

  • 原理直观
  • 只用到总体矩,方法简单,若总体矩不存在,则无法使用矩估计法(反例:Cauchy分布)
  • 矩估计基于大数定律,所以通常在大样本情况下才有较好的效果。