多维随机变量及其分布
知识框架
n维随机变量及其分布函数
概念
将X变为$X_1,X_2,\dots,X_n$,$X_i(i=1,2,\dots,n)$称为第$i$个分量,当$n=2$时,称(X,Y)为二维随机变量或二维随机向量。
对任意的$n$个实数$x_1,x_2,…,x_n$,称$n$元函数
$$
F(x_1,x_2,\dots,x_n)=P(X_1\leq x_1,X_2\leq x_2,\dots,X_n\leq x_n)
$$
为$n$维随机变量$(X_1,X_2,\dots,X_n)$的分布函数或随机变量$(X_1,X_2,\dots,X_n)$的联合分布函数。
当$n=2$时,对任意的实数$x,y$,称二元函数
$$
F(x,y)=P(X\leq x, Y\leq y)
$$
为二维随机变量$(x,y)$的分布函数或随机变量$X$和$Y$的联合分布函数,记为$(X,Y)\sim F(x,y)$。
分布函数性质
单调性:$F(x,y)$是$x,y$的单调不减函数:
- 对任意固定的$y$,当$x_1<x_2$时,$F(x_1,y)\leq F(x_2,y)$;
- 对任意固定的$x$,当$y_1<y_2$时,$F(x,y_1)\leq F(x,y_2)$;
右连续性:$F(x,y)$是$x,y$的右连续函数:
- $\lim_{x \to x_{0}^{+}} F(x,y) = F(x_0+0,y)=F(x_0,y)$
- $\lim_{y \to y_{0}^{+}} F(x,y) = F(x,y_0+0)=F(x,y_0)$
有界性:
- $F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0$
- $F(+\infty,+\infty)=1$
非负性:对于任意的$x_1< x_2,y_1< y_2$,有
$$
P(x_1<X\leq x_2,y_1< Y\leq y_2)=F(x_2,y_2)-F(x_2,y_1)-F(x_1,y_2)+F(x_1,y_1)\geq 0
$$
边缘分布函数:
设二维随机变量$(X,Y)$的分布函数为$F(x,y)$,随机变量$X$与$Y$的分布函数$F_X(x)$与$F_Y(y)$分别称为$(X,Y)$关于$Y$和$Y$关于的边缘分布函数,由概率性质得
$$
F_X(x)=P(X\leq x)=P(X\leq x,Y<+\infty)=\lim_{y \to+\infty}P(X\leq x,Y\leq y)=\lim_{y \to+\infty}F(x,y)=F(x,+\infty)
$$
同理,有$F_Y(y)=F(+\infty,y)$
离散型随机变量
二维随机变量$(X,Y)$的可能取值是有限对值或可列无限对值,称$p_{ij}=P(X=x_i,Y=y_i)(i,j=1,2,…)$为$(X,Y)$的分布律或随机变量$X$和$Y$的联合分布律,记为$(X,Y)\sim p_{ij}$,其充分必要条件为:
$$
p_{ij}\geq 0,\sum_{i=1}^{\infty} \sum_{j=1}^{\infty}p_{ij}=1
$$
联合分布函数:
设$(X,Y)$的概率分布为$p_{ij},i,j=1,2,…$,则$(X,Y)$的分布函数函数或$X$和$Y$的联合分布函数为
$$
F(x,y)=P(X\leq x,Y\leq y)=\sum_{x_i\leq x}\sum_{y_i\leq y}p_{ij}
$$
设G是平面上的某个区域,则:
$$
P((X,Y)\in G)=\sum_{(x_i,y_i)\in G}p_{ij}
$$
边缘分布:
$$
p_{i*}=p(X=x_i)=\sum_{j=1}^{\infty}P(X=x_i,Y=y_j)=\sum_{j=1}^{\infty}p_{ij}(i=1,2,…)
$$
$$
p_{*j}=p(Y=y_j)=\sum_{i=1}^{\infty}P(X=x_i,Y=y_i)=\sum_{i=1}^{\infty}p_{ij}(j=1,2,…)
$$
条件分布律:
连续型随机变量
二维随机变量(X,Y)的分布函数可表示为
$$
F(x,y)=\int_{-\infty}^ydv\int_{-\infty}^xf(u,v)du,(x,y)\in R^2
$$
其中f(x,y)为非负可积函数,(X,Y)二维连续性随机变量,f(x,y)为(X,Y)的概率密度,记为$(X,Y)\sim f(x,y)$
f(x,y)为概率密度的充要条件:
$$
f(x,y)\geq 0,\int_{-\infty}^{+\infty}dy\int_{-\infty}^{+\infty}f(x,y)dx=1
$$
性质:
- $F(x,y)=P(X\leq x,Y\leq y)=\int_{-\infty}^ydv\int_{-\infty}^xf(u,v)du$
- 设G为平面上某个区域,则$P((X,Y)\in G)=\int\int_Gf(x,y)dxdy$
- 若f(x,y)在点(x,y)连续,则$\frac{\partial^2 F(x,y)}{\partial x \partial y}=f(x,y)$
- 若F(x,y)连续且可导,则(X,Y)是连续型随机变量,且$\frac{\partial^2 F(x,y)}{\partial x \partial y}$是它的概率密度
边缘分布函数:
$$
F_X(x)=F(x,+\infty)=\int_{-\infty}^x[\int_{-\infty}^{+\infty}f(u,v)dv]du
$$
边缘概率密度:
$$
f_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy
$$
条件概率密度:X在Y=y的条件下的条件分布函数
$$
f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(x)}(f_Y(y)>0)
$$
因此条件分布函数可以表示为
$$
F_{X|Y}(x|y)=\int_{-\infty}^xf_{X|Y}(x|y)dx=\int_{-\infty}^x\frac{f(x,y)}{f_Y(y)}dx
$$
二维均匀分布:
$$
f(x,y) = \begin{cases}
\frac{1}{S_D} & (x,y)\in D \
0 & 其他
\end{cases}
$$
其中$S_D$为区域D的面积,称(X,Y)在平面有界区域D上服从均匀分布
二维正态分布:
$$
f(x, y) = \frac{1}{2 \pi \sigma_1 \sigma_2 \sqrt{1 - \rho^2}} \exp \left{ -\frac{1}{2(1 - \rho^2)} \left[ \left( \frac{x - \mu_1}{\sigma_1} \right)^2 - 2 \rho \left( \frac{x - \mu_1}{\sigma_1} \right) \left( \frac{y - \mu_2}{\sigma_2} \right) + \left( \frac{y - \mu_2}{\sigma_2} \right)^2 \right] \right}
$$
其中$u_1\in R,u_2\in R,\sigma_1>0,\sigma_2>0,-1<\rho<1$,则称$(X,Y)$服从参数为$u_1,u_2,\sigma_1^2,\sigma_2^2,\rho$的二维正态分布,记为$(X,Y)\sim N(u_1,u_2,\sigma_1^2,\sigma_2^2,\rho)$
若(x,y)相互独立,则$\rho$=0(充要条件)
随机变量的相互独立性
设二维随机变量(X,Y)的分布函数为F(x,y),边缘分布函数分别为$F_X(x),F_Y(y)$,如果对任意的实数x,y都有$F(x,y)=F_X(x)\cdot F_Y(y)$则称X与Y相互独立,否则则称X与Y不相互独立。
相互独立的充要条件:
- 离散型随机变量:联合分布等于边缘分布相乘,适用于某点或某区间$P(X\leq x,Y\leq y)=P(X\leq x)\cdot P(Y\leq y)$
- 连续型随机变量:概率密度等于边缘概率密度相乘,$f(x,y)=f_X(x)\cdot f_y(Y)$
二维正态随机变量$X,Y$,参数($\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho$),$\rho=0$==$X,Y$相互独立
相互独立的性质: