Probability Course in 2019 Spring

随机变量及其概率分布

随机变量及其分布函数

随机变量

  • 定义2.1
    设$\varOmega=\{e\}$是随机试验的样本空间, 如果对每个$e\in\varOmega$, 都对应一个单值实函数$X=X(e)$, 称$X$为随机变量
    随机变量在某范围内取值表示随机事件
  • 概率分布
    随机变量的取值与概率的对应关系, 称之为$X$的概率分布

随机变量的分布函数

  • 定义2.2
    设$X$是一个随机变量, $x$是任意实数, 称函数
    $$F(X)=P(X\leq x)(-\infty<x<\infty)$$
    为随机变量$X$的分布函数
  • 基本性质
    1. $F(x)$为单调不减函数, 即对任意实数$x_2>x_1$, 有$F(x_2)\geq F(x_1)$
    2. $0\leq F(x)\leq 1$, 且$F(-\infty)=\lim_{x\to-\infty}F(x)=0$, $F(+\infty)=\lim_{x\to+\infty}F(x)=1$
    3. $F(x)$为右连续, 即$F(x_0+0)=\lim{x\to x_0+0}F(x)=F(x_0)$
      任意随机变量的分布函数必满足这三个性质, 满足这三个性质的必定为某个随机变量的分布函数

离散型随机变量及其分布

离散型随机变量

  • 定义2.3
    若随机变量$X$的可能取值为有限个或可列无限多个, 则称$X$为离散型随机变量
  • 定义2.4
    设离散型随机变量$X$的所有可能取值为$x_1,x_2,\cdots,x_n,\cdots$, $X$取值$x_k$的相应概率为$p_k$, 即
    $$P(X=x_k)=p_k$$
    称之为离散型随机变量$X$的分布律, 分布律具有如下性质
    1. $p_k\geq0$, $k=1,2,\cdots$
    2. $\sum_{k}p_k=1$

常见离散型随机变量

  • 0-1分布
    若随机变量的可能取值只有0, 1, 且
    $$P(X=1)=p, P(X=0)=q, (0<p<1, q=1-p)$$
    则称$X$服从0-1分布

  • 二项分布
    若随机变量的分布律为
    $$p_k=P(X=k)=C_n^kp^kq^{n-k}, k=0,1,\cdots, n$$
    其中$0<p<1,q=1-p$, 则称$X$服从参数为$n,p$的二项分布, 记为$X\sim B(n,p)$

  • 泊松分布
    如果随机变量$X$的分布律为
    $$p_k=P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}, k=0,1,2,\cdots$$
    其中$\lambda>0$为常数, 则称$X$服从参数为$\lambda$的泊松分布, 记为$X\sim P(\lambda)$
    是用于表示大量试验稀有事件出现的频数的概率模型

    • $\lambda$的概率意义: 事件的平均发生次数
  • 几何分布
    若随机变量X的分布律为
    $$p\{X=k\}=q^{k-1}p$$
    其中$0<p<1,q=1-p$, 则称$X$服从参数为$p$的二项分布, 记为$X\sim G(p)$
    表示贝努里试验进行到事件首次出现为止, 所需次数$X$服从几何分布
  • 超几何分布
    $$p\{X=k\}=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n},k=0,1,\cdots,\min(n,M)$$
    其中$n,M,N$为参数, 则称$X$服从参数为$n,M,N$的超几何分布, 记为$X\sim H(n,M,N)$
    表示不放回随机抽样
    若放回, 则满足二项分布$B(n, \frac{M}{N})$, 若$N\to\infty$, 与二项分布近似相等

连续型随机变量及其分布

连续型随机变量

  • 定义2.5
    设随机变量$X$的分布函数为$F(x)$, 若存在非负可积函数$p(x)$, 对任意实数$x$有
    $$F(x)=\int_{-\infty}^xp(t)dt$$
    则称$X$为连续型随机变量, 称$p(x)$为$X$的概率密度函数, 简称密度函数
    由定义可见, 任何连续型随机变量的密度函数具有如下性质:
    1. $p(x)\geq 0$
    2. $\int_{-\infty}^{+\infty}p(x)dx=1$
    3. 对于任意实数$a,b(a<b)$
      $$P(a<X\leq b)=F(b)-F(a)=\int_a^bp(x)dx$$
    4. 由于$p(x)$为可积函数, 根据微积分性质, 分布函数$F(x)$为连续函数
    5. 若$p(x)$在$x$连续, 则分布函数$F(x)$可导, 且$p(x)=F’(x)$

常见连续型随机变量

  • 均匀分布
    若随机变量$X$的概率密度函数为
    $$p(x)=\begin{cases}
    \frac{1}{b-a} &a<x<b \\
    0 &其他
    \end{cases}$$
    则称$X$在区间$[a,b]$上服从均匀分布, 记为$X\sim U[a,b]$
    $X$的分布函数为
    $$F(x)=\begin{cases}
    0 &x<a\\
    \frac{x-a}{b-a} &a\leq x<b\\
    1 &x\geq b
    \end{cases}$$
  • 指数分布
    若随机变量$X$的概率密度函数为
    $$p(x)=\begin{cases}
    \lambda e^{-\lambda x} & x\geq 0\\
    0 &x<0
    \end{cases}$$
    则称$X$服从参数为$\lambda$的指数分布, 记为$X\sim E(\lambda)$
    $X$的分布函数为
    $$F(X)=\begin{cases}
    1-e^{-\lambda x} &x\geq 0\\
    0 &其他
    \end{cases}$$
  • 正态分布
    若随机变量$X$的密度函数为
    $$p(x)=\frac{1}{\sqrt{2\pi\sigma}}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt,-\infty < x <\infty$$
    其中$\mu,\sigma(>0)$为常数, 则称$X$服从参数为$\mu,\sigma^2$的正态分布, 记为$X\sim N(\mu, \sigma^2)$
    正态分布的分布函数为
    $$F(x)=\int_{-\infty}^x\frac{1}{\sqrt{2\pi\sigma}}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt$$
    当$\mu=0, \sigma =1$时, $X\sim N(0, 1)$, 称$X$服从标准正态分布, 其密度函数和分布函数特别记为$\varphi(x)$和$\varPhi(x)$
    $$\varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}$$
    $$\varPhi(x)=\int_{-\infty}^x\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}$$
    对标准正态分布的分布函数$varPhi(x)$有, $\varPhi(-x)=1-\varPhi(x)$
  • 定理2.1
    若随机变量$X\sim N(\mu, \sigma^2)$, 则$Z=\frac{X-\mu}{\sigma}\sim N(0, 1)$

随机变量函数的分布

  • 随机变量的函数
    设$X$是随机变量, $y=g(x)$是普通实函数。构造随机变量$Y$, $X$当取值时$x$时, $Y$取值$y=g(x)$,称$Y$是随机变量$X$的函数,记为$Y=g(X)$. 我们需要讨论,已知$X$的概率分布,如何求$Y=g(X)$的概率分布. 分为离散型和连续型两种情况讨论.

离散型随机变量的函数

  • 设$X$是离散型随机变量, 其分布律为$x_k\mapsto p_k$, 对于$X$的函数$Y=g(X)$, $Y$也是离散型随机变量
    1. 若$y_1,y_2,\cdots, y_n,\cdots$互不相同, 则:
      $$P(Y=y_k)=P(Y=g(x_k))=P(X=x_k)=p_k$$
    2. 若有相同的, 则相同的$y_k$对应的概率相加:
      $$P(Y=y_k)=\sum_{i:y_k=g(x_i)}P(X=x_i)$$

连续型随机变量的函数

  • 设$X$是连续型随机变量, $y=g(x)$为连续实函数, 则$Y=g(X)$也是连续型随机变量. 己知$X$的密度函数$p_X(x)$,求$Y$的密度函数$p_Y(y)$.
    常用的方法是分布函数法,即先求Y的分布函数$F_Y(y)$
    $$F_Y(y)=P(Y\leq y)=P(g(X)\leq y)=\int_{x:g(x)\leq y}p_X(x)dx$$
  • 然后$p_Y=(y)=F’_Y(y)$

  • 定理
    若随机变量$X$的分布函数$F(x)$严格单调递增, 则随机变量$Y=F(X)$服从$[0,1]$上的均匀分布

  • 定理2.2
    设随机变量$X$的可能取值范围为$(a,b)$, $X$的概率密度为$p(x)$,$a<x<b$(其中$a$可为$-\infty$, $b$可为$+\infty$), 设函数$y=(x)$处处可导, 且恒有$g’(x)>0$(或恒有$g’(x)<0$), 则$Y=g(X)$为连续型随机变量,其概率密度为
    $$p_Y(y)=\begin{cases}
    p_X[g^{-1}(y)]\cdot|[g^{-1}(y)]’| &\alpha<y<\beta\\
    0 &其他
    \end{cases}$$
    其中$\alpha=\min\{g(a),g(b)\}$, $\beta=\max\{g(a),g(b)\}$, $g^{-1}(y)$为$y=g(x)$的反函数