数理统计

知识结构

知识结构

总体与样本

总体:试验中全部的可能观测到的值

    有限总体:总体中的个体为有限个(离散型) 放回抽样(总量>>样本数,可以不放回)

    无限总体:总体中的个体为无限个(连续性) 不放回抽样

个体:每一个可能被观测到的值

通过抽取部分个体来判断总体:

    总体X服从的分布不知道或知道服从分布的形式而不知道具体的参数

如何抽取:

    在相同条件下,进行n次独立重复抽取,产生了$X_1,X_2,\dots ,X_n$,{$X_n$}叫做样本,且与X服从相同分布,$x_1,x_2,\dots ,x_n$叫做样本值/观测值。

统计量及其分布

统计量的定义:
    设$X_1,X_2,\dots ,X_n$是来自总体的X的一个样本,$g(X_1,X_2,\dots ,X_n)$是$X_1,X_2,\dots ,X_n$的函数,若g中不包含未知参数,则称$g(X_1,X_2,\dots ,X_n)$为一个统计量,$g(x_1,x_2,\dots ,x_n)$统计量的观测值。

典型统计量

  1. 样本平均值:$\bar{X}=\frac{1}{n}\sum^n_{i=1}X_i$
  2. 观测值平均值:$\bar{x}=\frac{1}{n}\sum^n_{i=1}x_i$
  3. 样本方差:$S^2=\frac{1}{n-1}(X_i-\bar{X})^2=\frac{1}{n-1}(\sum^n_{i=1}X_i^2-n\bar{X})$除n-1是考虑无偏性,为了样本方差的期望等于总体方差
  4. 样本标准差:$S=\sqrt{S^2}$
  5. 样本的k阶源点矩:$A_k=\frac{1}{n}\sum^n_{i=1}(X_i-0)^k$
  6. 样本的k阶中心矩:$B_K=\frac{1}{n}\sum_{i=1}^n(X_i-\bar{X})^k$

经验分布函数(样本分布函数)

根据抽出的样本得到的函数

    从总体x中抽取一个容量为n的样本,,观测值为$x_1,x_2,\dots ,x_n$,升序排序为$x_{(1)},x_{(2)},\dots ,x_{(n)}$,以下为经验分布函数:
$$
F_n(x) = \begin{cases}
0, & x < x_{(1)} \
\frac{k}{n}, & x_{(k)} \leq x < x_{(k+1)}, k = 1, 2, 3, \ldots ,n-1\
1, & x \geq x_{(n)}
\end{cases}
$$
格列汶科定理:n趋于无穷时,$F_n(x)$依概率收敛于$F(x)$

卡方分布$\chi ^2$

    样本$X_1,X_2,\dots ,X_n$来自标准正态分布的总体$X\sim N(0,1)$,若统计量$\chi ^2=x_1^2+x_2^2+\dots +x_n^2$,则$\chi ^2$服从自由度为n的卡方分布,记作$\chi ^2 \sim \chi ^2(n)$(前一个为变量,后一个为卡方分布)

自由度:卡方统计量右边独立变量的个数。

为连续性随机变量,概率密度为

$$
f(x) = \begin{cases}
\frac{1}{2^{\frac{n}{2}} \cdot \Gamma\left(\frac{n}{2}\right)} \cdot x^{\frac{n}{2} - 1} \cdot e^{-\frac{x}{2}}, & x > 0 \
0, & \text{其他}
\end{cases}
$$

性质

  • $E[\chi ^2(n)]=n$
  • $D[\chi ^2(n)]=2n$
  • $X \sim \chi ^2(m)$,$Y \sim \chi ^2(n)$,X与Y相互独立,则$X+Y \sim \chi ^2(m+n)$
  • $\chi ^2(n)$分布的上$\alpha$分位点,即存在一点使得$P(\chi ^2(n)\geq \alpha)=\alpha$成立,该点记作$\chi_{\alpha}^2(n)$

上分位点

卡方分布例题

T分布

    $X\sim N(0,1),Y\sim \chi ^2(n)$,$X$与$Y$相互独立,$t=\frac{X}{\sqrt{\frac{Y}{n}}}$服从自由度为n的t分布,记作$t\sim t(n)$

概率密度的函数图像

t分布概率密度图像

性质

  • $E[t(n)]=0$
  • $D[t(n)]=\frac{n}{n-2}$
  • n趋于无穷时,t分布近似等于标准正态分布$N(0,1)$
  • t分布的上$\alpha$分位点,同理与卡方分布,存在一点$\alpha$使得$P(t(n)\geq \alpha)=\alpha$成立,该点记作$t_{\alpha}(n)$

由于分布函数关于y轴对称性,因此在负半轴还有一个点,$-t_{\alpha}(n)=t_{1-\alpha}(n)$

t分布理解例题

t分布表查找

    纵轴为自由度,横轴为大于某点的概率,查到的点即为该点的坐标。

t分布表查找

F分布

    $U\sim \chi ^2(n_1),V\sim \chi ^2(n_2)$,$U$和$V$相互独立,观测量$F=\frac{\frac{U}{n_1}}{\frac{V}{n_2}}$服从自由度为$(n_1,n_2)$的F分布,记为$F\sim F(n_1,n_2)$

概率密度函数图像

f分布概率密度函数图像

性质

  • $E(F)=\frac{n_2}{n_2-2}$
  • $D(F)=\frac{2n_2^2(n_1+n_2-2)}{n_1(n_2-2)^2(n_2-4)}$
  • F分布的上$\alpha$分位点,同理与卡方分布,存在一点$\alpha$使得$P(x\geq \alpha)=\alpha$成立,该点记作$F_{\alpha}(n_1,n_2)$
  • ==$F_{1-\alpha}(n_1,n_2)=\frac{1}{F_{\alpha}(n_2,n_1)}$==

F分布理解例题

F分布表查找

    由于有三个变量,因此我们只能设定$\alpha$的值并根据$n_1,n_2$的值来进行查找

F分布表查找

正态总体样本均值与样本方差的函数分布

四个等式

  • $E(\bar{X})=\mu$
  • $D(\bar{X})=\frac{\sigma^2}{n}$
  • $E(S^2)=\sigma^2$ 样本方差的期望等于总体方差,样本方差依概率收敛于总体方差。
  • $D(S^2)=\frac{2\sigma ^4}{n-1}$

四个定理

    $X_1,X_2,\dots ,X_{n_1}$来自总体$X\sim N(\mu_1,\sigma_1^2)$,有$\bar{X}$和$S_1^2$,$Y_1,Y_2,\dots ,Y_{n_2}$来自总体$T\sim N(\mu_2,\sigma_2^2)$,有$\bar{Y}$和$S_2^2$

  • $\bar{X}\sim N(\mu,\frac{\sigma_1^2}{n_1})$
  • $\frac{\sum_{i=1}^n(X_i-\bar{X})^2}{\sigma_1^2}=\frac{(n_1-1)S_1^2}{\sigma_1^2}\sim \chi^2(n_1-1)$且样本的均值与样本方差相互独立
  • $\frac{\bar{X}-\mu_1}{S_1/\sqrt{n_1}}\sim t(n_1-1)$
  • $\frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2}\sim F(n_1-1,n_2-1)$

    若$\sigma_1^2=\sigma_2^2=\sigma^2$时,$\frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2)$,其中$S_w=\sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}}$

参数估计

用样本的统计量来估计总体的参数,分为点估计和区间估计

点估计

    总体X的分布函数的形式已知,一些参数未知,用样本的统计量来估计总体参数的值。

    点估计的思路:用样本来构造一个恰当的统计量$\hat{\theta}(X_1,X_2,\dots ,X_n)$,用改统计量的观测值$\hat{\theta}(x_1,x_2,\dots ,x_n)$可以作为位置参数的近似值(估计值)

估计量的观测值为估计值

矩估计法

    X为连续性随机变量$f(x;\theta_1,\theta_2\dots,\theta_k),X_1.X_2,\dots,X_n$是来自总体X的样本,设X的前$k$阶矩(总体矩)

  • $u_1=E[(X-0)^1]=E(X)=\int^{+\infty}_{-\infty}x\cdot f(x;\theta_1,\theta_2\dots,\theta_k)dx=u_1(\theta_1,\theta_2\dots,\theta_k)$(一个以$(\theta_1,\theta_2\dots,\theta_k)$为自变量的函数)
  • $u_2=E[(X-0)^2]=E(X^2)=\int^{+\infty}_{-\infty}x^2\cdot f(x;\theta_1,\theta_2\dots,\theta_k)dx=u_2(\theta_1,\theta_2\dots,\theta_k)$
  • $\dots$
  • $u_k=E[(X-0)^k]=E(X^k)=\int^{+\infty}_{-\infty}x^k\cdot f(x;\theta_1,\theta_2\dots,\theta_k)dx=u_k(\theta_1,\theta_2\dots,\theta_k)$

    k个方程,k个未知数,可全解:

  • $\theta_1=\theta_1(u_1,u_2\dots,u_k)$
  • $\theta_2=\theta_2(u_1,u_2\dots,u_k)$
  • $\dots $
  • $\theta_k = \theta_k(u_1,u_2\dots,u_k)$

    可知样本的原点矩为:

  • $A_1=\frac{1}{n}\sum^n_{i=1}X_i^1$
  • $A_2=\frac{1}{n}\sum^n_{i=1}X_i^2$
  • $\dots $
  • $A_k=\frac{1}{n}\sum^n_{i=1}X_i^k$

    用$A_i代替u_i$,从而求解得$\theta$,即

  • $\hat{\theta_1}=\theta_1(A_1,A_2\dots,A_k)$
  • $\hat{\theta_2}=\theta_2(A_1,A_2\dots,A_k)$
  • $\dots $
  • $\hat{\theta_k}=\theta_k(A_1,A_2\dots,A_k)$

    称$\hat{\theta _i}为\theta _i$的矩估计量,$\hat{\theta _i}$的观测值为矩估计值。

最大似然估计法

离散型

X的分布形式知道,$p(X=x)=p(x;\theta),\theta$为待估计的值,$X_1.X_2,\dots,X_n$是来自总体X的样本,$x_1.x_2,\dots,x_n$为样本值,则
$$
P(X_1=x_1,X_2=x_2,\dots,X_n=x_n)=p(X_1;\theta)\cdot p(X_2;\theta)\dots p(X_n;\theta) =L(x_1,x_2,\dots,X_n;\theta)=L(\theta)
$$
    取最大值时的$max L(x_1,x_2,\dots,x_n;\theta)=L(x_1,x_2,\dots,x_n;\hat{\theta})$,称$\hat{\theta}(=\hat{\theta}(X_1.X_2,\dots,X_n))$为$\theta$的最大似然估计量,称$\hat{\theta}(=\hat{\theta}(x_1.x_2,\dots,x_n))$为$\theta$的最大似然估计值

最大似然估计例题1

连续型


数理统计
http://2819461143wp.github.io/数理统计/
作者
cwdp.sky
发布于
2024年12月5日
许可协议