Probability Course in 2019 Spring

随机向量及其分布

  • 定义3.1
    若随机变量$X_1,X_2,\cdots, X_n$定义在同一个样本空间$\varOmega$上, 则称$(X_1,X_2.\cdots,X_n)$为一个$n$维随机向量或$n$维随机变量

二位随机向量及其分布函数

二维离散型随机向量

  • 定义3.2
    若二位随机向量$(X,Y)$的每个分量都是离散型的随机变量, 则称$(X,Y)$为一个二维离散型随机向量
  • 定义3.3
    设随机向量$(X,Y)$的所有可能取值为$(x_i,y_i)$, $i,j=1,2,\cdots$, 假设当$i\ne k, j\ne l$时, $x_i\ne x_k, y_j\ne y_l$, 则$P(X=x_i, Y=y_i)=p_{ij}$, $i=1,2,\cdots$称为随机向量$(X,Y)$的联合分布率或$X$和$Y$的联合概率分布
    由分布律的定义可以得到联合分布率$\{p_{ij}\}$具有下列性质:

    1. $p_{ij}\geq 0, i,j=1,2,\cdots$
    2. $\sum_{i=1}^{+\infty}\sum_{j=1}^{+\infty}p_{ij}=1$
  • 多项分布
    在$n$次独立重复实验中, 已知每次试验由三种不同的可能结果$A_1,A_2,A_3$, 且$P(A_i)=p_i$, $i=1,2,3$, $p_1+p_2+p_3=1$. 若以$X_1, X_2$分别记结果$A_1,A_2,A_3$出现的次数, 则任意的$k_i\in[0,n]\cap\mathbb{N}$, $i=1,2$
    $$P(X_1=k_1,X_2=k_2)=\frac{n!}{k_1!k_2!(n-k_1-k_2)!}p_1^{k_1}p_2^{k_2}(1-p_1-p_2)^{n-k_1-k_2}$$
    记为
    $$(X_1,X_2)\sim M(n;p_1,p_2,p_3)$$

  • 多元超几何分布
    设一个袋中分别标有1, 2或3的球, 设$i$号球有$N_i$只, $i=1,2,3$, 且$N_1+N_2+N_3=N$. 从中不放回地随机摸出$n$只, $n\leq N$, 若以$X_1$, $X_2$分别记1, 2号球的出现次数, 则$(X_1,X_2)$的联合概率分布为
    $$P(X_1=n_1,X_2=n_2)=\frac{C_{N_1}^{n_1}C_{N_2}^{n_2}C_{N_3}^{n_3}}{C_N^n}$$

  • 定义3.4
    对任意的实数$x,y$, 称二元函数$F(x,y)=P(X\leq x, Y\leq y)$为随机向量$(X,Y)$的 (联合)分布函数, 记为$(X,Y)\sim F(x,y)$
    若$(X,Y)$的分布律为$\{p_{ij}\}$, 则它的分布函数可由它的分布律表示:
    $$F(x,y)=\sum_{x_i\leq x, y_i\leq y}p_{ij}$$

  • 边缘分布函数
    $$F_X(x)=P(X\leq x)=P(X\leq x, y\leq +\infty)=\lim_{y\to+\infty}P(X\leq x,Y\leq y)\eqqcolon F(x,+\infty)$$
    $$F_Y(y)=F(+\infty, y)=\lim_{x\to +\infty}F(x,y)$$

二维连续型随机向量

  • 定义3.5
    设二维随机向量$(X,Y)$的分布函数为$F(x,y)$, 若存在非负可积二元函数$p(X,Y)$, 对任意的$x,y\in \mathbb{R}$, 有
    $$F(x,y)=\int_{-\infty}^x\int_{-\infty}^{y}p(u,v)dudv$$
    则称$(X,Y)$为二维连续型随机向量, 而称$p(X,Y)$为$(X,Y)$的一个联合概率密度函数, 简称为联合密度
    由分布律的定义可以得到联合概率密度函数$\{p(x,y)\}$具有下列性质:

    1. $p(x,y)\geq 0$
    2. $\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}p(x,y)dxdy=1$
  • 边缘密度函数
    $$p_X(x)=\int_{-\infty}^{+\infty}p(x,v)dv$$
    $$p_Y(y)=\int_{-\infty}^{+\infty}p(v,y)dv$$

联合密度函数

条件分布

离散型随机向量的条件概率分布

  • 在$X=x_i$下, $Y$的条件分布律
    $$P(Y=y_i|X=x_i)=\frac{P(Y=y_i,X=x_i)}{P(X=x_i)}=\frac{p_{ij}}{p_i}$$

  • $Y$的边际分布
    $$P(Y=y_i)=\sum_{i=1}^{+\infty}P(Y=y_i,X=x_i)=\sum_{i=1}^{+\infty}P(Y=y_i|X=x_i)P(X=x_i)$$

连续型随机变量的条件概率

  • 在$X=x$的条件下, $Y$的条件分布函数
    $$F_{Y|X=x}(y)=P(Y\leq y|X=x)=\int_{-\infty}^{y}\frac{p(x,v)}{p_X(x)}dv$$

  • 在$X=x$的条件下, $Y$的条件密度函数
    $$p_{Y|X=x}(y)=\frac{p(x,v)}{p_X(x)}$$

随机变量的独立性

  • 定义3.9
    设$X$和$Y$是两个离散型随机变量, 若对任意的一组$(x_i,y_j)$,
    $$P(X=x_i,Y=y_j)=P(X=x_i)P(Y=y_j)$$
    即对任意的$i,j$, $p_{ij}=p_i\cdot p_j$, 则称随机变量$X$和$Y$相互独立

  • 定义3.10
    设$X_1,X_2,\cdots,X_n$都是离散型随机变量, 若对任意的$x_1,x_2,\cdots x_n$,
    $$P(X=x_1,X=x_2,\cdots,X=x_n)=P(X=x_1)P(X=x_2)\cdots P(X=x_n)$$
    即对任意的$i,j$, $p_{ij}=p_i\cdot p_j$, 则称随机变量$X$和$Y$相互独立

  • 定理3.1
    设$X_1,X_2,\cdots,X_n$相互独立, 若函数$Y_1=g_1(X_1,X_2,\cdots,X_m)$和$Y_2=g_2(X_{m+1},X_{m+2},\cdots,X_n)$仍然是随机变量, 则$Y_1$和$Y_2$独立

  • 定义3.11
    设$n$维随机向量$(X_1,X_2,\cdots,X_n)$的联合密度函数为$p(x_1,x_2,\cdots,x_n)$, 而$X_i$的边缘密度函数为$p_i(x_i)$. 如果
    $$p(x_1,\cdots,x_n)=p_1(x_1)p_2(x_2)\cdots p_n(x_n)$$
    就称随机变量$X_1,X_2,\cdots,X_n$相互独立, 或者简称独立

  • 定理3.2
    独立的充要条件:
    $$F(x,y)=F_X(x)F_Y(y)$$

  • 定理3.3
    联合密度函数为$f(x,y)$时, 二者独立的充要条件:
    $$\exists g_1,g_2,\quad f(x,y)=g_1(x)g_2(y)$$

二维随机向量函数的分布

二维离散型随机向量函数的分布

二维连续性随机变量函数的分布

  1. 和的分布$Z=X+Y$
    $$p_Z(z)=\int_{-\infty}^{+\infty}p(x,z-x)dx$$

  2. 商的分布$Z+X/Y$
    $$p_Z(z)=\int_{-\infty}^{+\infty}|y|p(zy,y)dy$$

  3. 最大(小)值的分布$M=\max, N=\min$
    $$F_M(z)=F_X(z)F_Y(z)$$
    $$F_N(z)=1-(1-F_X(z))(1-F_Y(z))$$
    求导可得密度函数