多维随机变量及其分布

知识框架

知识框架

n维随机变量及其分布函数

概念

    将X变为$X_1,X_2,\dots,X_n$,$X_i(i=1,2,\dots,n)$称为第$i$个分量,当$n=2$时,称(X,Y)为二维随机变量或二维随机向量。

    对任意的$n$​个实数$x_1,x_2,…,x_n$,称$n$元函数
$$
F(x_1,x_2,\dots,x_n)=P(X_1\leq x_1,X_2\leq x_2,\dots,X_n\leq x_n)
$$
    为$n$维随机变量$(X_1,X_2,\dots,X_n)$的分布函数或随机变量$(X_1,X_2,\dots,X_n)$的联合分布函数。

    当$n=2$时,对任意的实数$x,y$,称二元函数
$$
F(x,y)=P(X\leq x, Y\leq y)
$$
    为二维随机变量$(x,y)$的分布函数或随机变量$X$和$Y$的联合分布函数,记为$(X,Y)\sim F(x,y)$。

分布函数性质

单调性:$F(x,y)$是$x,y$的单调不减函数:

  • 对任意固定的$y$,当$x_1<x_2$时,$F(x_1,y)\leq F(x_2,y)$;
  • 对任意固定的$x$,当$y_1<y_2$时,$F(x,y_1)\leq F(x,y_2)$;

右连续性:$F(x,y)$是$x,y$的右连续函数:

  • $\lim_{x \to x_{0}^{+}} F(x,y) = F(x_0+0,y)=F(x_0,y)$
  • $\lim_{y \to y_{0}^{+}} F(x,y) = F(x,y_0+0)=F(x,y_0)$

有界性

  • $F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0$
  • $F(+\infty,+\infty)=1$

非负性:对于任意的$x_1< x_2,y_1< y_2$,有
$$
P(x_1<X\leq x_2,y_1< Y\leq y_2)=F(x_2,y_2)-F(x_2,y_1)-F(x_1,y_2)+F(x_1,y_1)\geq 0
$$
边缘分布函数:

    设二维随机变量$(X,Y)$的分布函数为$F(x,y)$,随机变量$X$与$Y$的分布函数$F_X(x)$与$F_Y(y)$分别称为$(X,Y)$关于$Y$和$Y$关于的边缘分布函数,由概率性质得
$$
F_X(x)=P(X\leq x)=P(X\leq x,Y<+\infty)=\lim_{y \to+\infty}P(X\leq x,Y\leq y)=\lim_{y \to+\infty}F(x,y)=F(x,+\infty)
$$
    同理,有$F_Y(y)=F(+\infty,y)$

离散型随机变量

    二维随机变量$(X,Y)$的可能取值是有限对值或可列无限对值,称$p_{ij}=P(X=x_i,Y=y_i)(i,j=1,2,…)$为$(X,Y)$的分布律或随机变量$X$和$Y$的联合分布律,记为$(X,Y)\sim p_{ij}$,其充分必要条件为:
$$
p_{ij}\geq 0,\sum_{i=1}^{\infty} \sum_{j=1}^{\infty}p_{ij}=1
$$
联合分布函数:

    设$(X,Y)$的概率分布为$p_{ij},i,j=1,2,…$,则$(X,Y)$的分布函数函数或$X$和$Y$的联合分布函数为
$$
F(x,y)=P(X\leq x,Y\leq y)=\sum_{x_i\leq x}\sum_{y_i\leq y}p_{ij}
$$
    设G是平面上的某个区域,则:
$$
P((X,Y)\in G)=\sum_{(x_i,y_i)\in G}p_{ij}
$$
边缘分布
$$
p_{i*}=p(X=x_i)=\sum_{j=1}^{\infty}P(X=x_i,Y=y_j)=\sum_{j=1}^{\infty}p_{ij}(i=1,2,…)
$$

$$
p_{*j}=p(Y=y_j)=\sum_{i=1}^{\infty}P(X=x_i,Y=y_i)=\sum_{i=1}^{\infty}p_{ij}(j=1,2,…)
$$
条件分布律
离散条件分布

连续型随机变量

    二维随机变量(X,Y)的分布函数可表示为
$$
F(x,y)=\int_{-\infty}^ydv\int_{-\infty}^xf(u,v)du,(x,y)\in R^2
$$
    其中f(x,y)为非负可积函数,(X,Y)二维连续性随机变量,f(x,y)为(X,Y)的概率密度,记为$(X,Y)\sim f(x,y)$

    f(x,y)为概率密度的充要条件:
$$
f(x,y)\geq 0,\int_{-\infty}^{+\infty}dy\int_{-\infty}^{+\infty}f(x,y)dx=1
$$

性质:

  • $F(x,y)=P(X\leq x,Y\leq y)=\int_{-\infty}^ydv\int_{-\infty}^xf(u,v)du$
  • 设G为平面上某个区域,则$P((X,Y)\in G)=\int\int_Gf(x,y)dxdy$
  • 若f(x,y)在点(x,y)连续,则$\frac{\partial^2 F(x,y)}{\partial x \partial y}=f(x,y)$
  • 若F(x,y)连续且可导,则(X,Y)是连续型随机变量,且$\frac{\partial^2 F(x,y)}{\partial x \partial y}$是它的概率密度

边缘分布函数:
$$
F_X(x)=F(x,+\infty)=\int_{-\infty}^x[\int_{-\infty}^{+\infty}f(u,v)dv]du
$$
边缘概率密度:
$$
f_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy
$$
条件概率密度:X在Y=y的条件下的条件分布函数
$$
f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(x)}(f_Y(y)>0)
$$
因此条件分布函数可以表示为
$$
F_{X|Y}(x|y)=\int_{-\infty}^xf_{X|Y}(x|y)dx=\int_{-\infty}^x\frac{f(x,y)}{f_Y(y)}dx
$$

二维均匀分布:

$$
f(x,y) = \begin{cases}
\frac{1}{S_D} & (x,y)\in D \
0 & 其他
\end{cases}
$$
    其中$S_D$为区域D的面积,称(X,Y)在平面有界区域D上服从均匀分布

二维正态分布:

$$
f(x, y) = \frac{1}{2 \pi \sigma_1 \sigma_2 \sqrt{1 - \rho^2}} \exp \left{ -\frac{1}{2(1 - \rho^2)} \left[ \left( \frac{x - \mu_1}{\sigma_1} \right)^2 - 2 \rho \left( \frac{x - \mu_1}{\sigma_1} \right) \left( \frac{y - \mu_2}{\sigma_2} \right) + \left( \frac{y - \mu_2}{\sigma_2} \right)^2 \right] \right}
$$
    其中$u_1\in R,u_2\in R,\sigma_1>0,\sigma_2>0,-1<\rho<1$,则称$(X,Y)$服从参数为$u_1,u_2,\sigma_1^2,\sigma_2^2,\rho$的二维正态分布,记为$(X,Y)\sim N(u_1,u_2,\sigma_1^2,\sigma_2^2,\rho)$

若(x,y)相互独立,则$\rho$=0(充要条件)

随机变量的相互独立性

    设二维随机变量(X,Y)的分布函数为F(x,y),边缘分布函数分别为$F_X(x),F_Y(y)$,如果对任意的实数x,y都有$F(x,y)=F_X(x)\cdot F_Y(y)$则称X与Y相互独立,否则则称X与Y不相互独立。

相互独立的充要条件:

  • 离散型随机变量:联合分布等于边缘分布相乘,适用于某点或某区间$P(X\leq x,Y\leq y)=P(X\leq x)\cdot P(Y\leq y)$
  • 连续型随机变量:概率密度等于边缘概率密度相乘,$f(x,y)=f_X(x)\cdot f_y(Y)$

二维正态随机变量$X,Y$,参数($\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho$),$\rho=0$==$X,Y$相互独立

相互独立的性质:


多维随机变量及其分布
http://2819461143wp.github.io/多维随机变量及其分布/
作者
cwdp.sky
发布于
2024年10月24日
许可协议