Probability Course in 2019 Spring
随机变量及其概率分布
随机变量及其分布函数
随机变量
- 定义2.1
设$\varOmega=\{e\}$是随机试验的样本空间, 如果对每个$e\in\varOmega$, 都对应一个单值实函数$X=X(e)$, 称$X$为随机变量
随机变量在某范围内取值表示随机事件 - 概率分布
随机变量的取值与概率的对应关系, 称之为$X$的概率分布
随机变量的分布函数
- 定义2.2
设$X$是一个随机变量, $x$是任意实数, 称函数
$$F(X)=P(X\leq x)(-\infty<x<\infty)$$
为随机变量$X$的分布函数 - 基本性质
- $F(x)$为单调不减函数, 即对任意实数$x_2>x_1$, 有$F(x_2)\geq F(x_1)$
- $0\leq F(x)\leq 1$, 且$F(-\infty)=\lim_{x\to-\infty}F(x)=0$, $F(+\infty)=\lim_{x\to+\infty}F(x)=1$
- $F(x)$为右连续, 即$F(x_0+0)=\lim{x\to x_0+0}F(x)=F(x_0)$
任意随机变量的分布函数必满足这三个性质, 满足这三个性质的必定为某个随机变量的分布函数
离散型随机变量及其分布
离散型随机变量
- 定义2.3
若随机变量$X$的可能取值为有限个或可列无限多个, 则称$X$为离散型随机变量 - 定义2.4
设离散型随机变量$X$的所有可能取值为$x_1,x_2,\cdots,x_n,\cdots$, $X$取值$x_k$的相应概率为$p_k$, 即
$$P(X=x_k)=p_k$$
称之为离散型随机变量$X$的分布律, 分布律具有如下性质- $p_k\geq0$, $k=1,2,\cdots$
- $\sum_{k}p_k=1$
常见离散型随机变量
0-1分布
若随机变量的可能取值只有0, 1, 且
$$P(X=1)=p, P(X=0)=q, (0<p<1, q=1-p)$$
则称$X$服从0-1分布二项分布
若随机变量的分布律为
$$p_k=P(X=k)=C_n^kp^kq^{n-k}, k=0,1,\cdots, n$$
其中$0<p<1,q=1-p$, 则称$X$服从参数为$n,p$的二项分布, 记为$X\sim B(n,p)$泊松分布
如果随机变量$X$的分布律为
$$p_k=P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}, k=0,1,2,\cdots$$
其中$\lambda>0$为常数, 则称$X$服从参数为$\lambda$的泊松分布, 记为$X\sim P(\lambda)$
是用于表示大量试验中稀有事件出现的频数的概率模型- $\lambda$的概率意义: 事件的平均发生次数
- 几何分布
若随机变量X的分布律为
$$p\{X=k\}=q^{k-1}p$$
其中$0<p<1,q=1-p$, 则称$X$服从参数为$p$的二项分布, 记为$X\sim G(p)$
表示贝努里试验进行到事件首次出现为止, 所需次数$X$服从几何分布 - 超几何分布
$$p\{X=k\}=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n},k=0,1,\cdots,\min(n,M)$$
其中$n,M,N$为参数, 则称$X$服从参数为$n,M,N$的超几何分布, 记为$X\sim H(n,M,N)$
表示不放回随机抽样
若放回, 则满足二项分布$B(n, \frac{M}{N})$, 若$N\to\infty$, 与二项分布近似相等
连续型随机变量及其分布
连续型随机变量
- 定义2.5
设随机变量$X$的分布函数为$F(x)$, 若存在非负可积函数$p(x)$, 对任意实数$x$有
$$F(x)=\int_{-\infty}^xp(t)dt$$
则称$X$为连续型随机变量, 称$p(x)$为$X$的概率密度函数, 简称密度函数
由定义可见, 任何连续型随机变量的密度函数具有如下性质:- $p(x)\geq 0$
- $\int_{-\infty}^{+\infty}p(x)dx=1$
- 对于任意实数$a,b(a<b)$
$$P(a<X\leq b)=F(b)-F(a)=\int_a^bp(x)dx$$ - 由于$p(x)$为可积函数, 根据微积分性质, 分布函数$F(x)$为连续函数
- 若$p(x)$在$x$连续, 则分布函数$F(x)$可导, 且$p(x)=F’(x)$
常见连续型随机变量
- 均匀分布
若随机变量$X$的概率密度函数为
$$p(x)=\begin{cases}
\frac{1}{b-a} &a<x<b \\
0 &其他
\end{cases}$$
则称$X$在区间$[a,b]$上服从均匀分布, 记为$X\sim U[a,b]$
$X$的分布函数为
$$F(x)=\begin{cases}
0 &x<a\\
\frac{x-a}{b-a} &a\leq x<b\\
1 &x\geq b
\end{cases}$$ - 指数分布
若随机变量$X$的概率密度函数为
$$p(x)=\begin{cases}
\lambda e^{-\lambda x} & x\geq 0\\
0 &x<0
\end{cases}$$
则称$X$服从参数为$\lambda$的指数分布, 记为$X\sim E(\lambda)$
$X$的分布函数为
$$F(X)=\begin{cases}
1-e^{-\lambda x} &x\geq 0\\
0 &其他
\end{cases}$$ - 正态分布
若随机变量$X$的密度函数为
$$p(x)=\frac{1}{\sqrt{2\pi\sigma}}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt,-\infty < x <\infty$$
其中$\mu,\sigma(>0)$为常数, 则称$X$服从参数为$\mu,\sigma^2$的正态分布, 记为$X\sim N(\mu, \sigma^2)$
正态分布的分布函数为
$$F(x)=\int_{-\infty}^x\frac{1}{\sqrt{2\pi\sigma}}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt$$
当$\mu=0, \sigma =1$时, $X\sim N(0, 1)$, 称$X$服从标准正态分布, 其密度函数和分布函数特别记为$\varphi(x)$和$\varPhi(x)$
$$\varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}$$
$$\varPhi(x)=\int_{-\infty}^x\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}$$
对标准正态分布的分布函数$varPhi(x)$有, $\varPhi(-x)=1-\varPhi(x)$ - 定理2.1
若随机变量$X\sim N(\mu, \sigma^2)$, 则$Z=\frac{X-\mu}{\sigma}\sim N(0, 1)$
随机变量函数的分布
- 随机变量的函数
设$X$是随机变量, $y=g(x)$是普通实函数。构造随机变量$Y$, $X$当取值时$x$时, $Y$取值$y=g(x)$,称$Y$是随机变量$X$的函数,记为$Y=g(X)$. 我们需要讨论,已知$X$的概率分布,如何求$Y=g(X)$的概率分布. 分为离散型和连续型两种情况讨论.
离散型随机变量的函数
- 设$X$是离散型随机变量, 其分布律为$x_k\mapsto p_k$, 对于$X$的函数$Y=g(X)$, $Y$也是离散型随机变量
- 若$y_1,y_2,\cdots, y_n,\cdots$互不相同, 则:
$$P(Y=y_k)=P(Y=g(x_k))=P(X=x_k)=p_k$$ - 若有相同的, 则相同的$y_k$对应的概率相加:
$$P(Y=y_k)=\sum_{i:y_k=g(x_i)}P(X=x_i)$$
- 若$y_1,y_2,\cdots, y_n,\cdots$互不相同, 则:
连续型随机变量的函数
- 设$X$是连续型随机变量, $y=g(x)$为连续实函数, 则$Y=g(X)$也是连续型随机变量. 己知$X$的密度函数$p_X(x)$,求$Y$的密度函数$p_Y(y)$.
常用的方法是分布函数法,即先求Y的分布函数$F_Y(y)$
$$F_Y(y)=P(Y\leq y)=P(g(X)\leq y)=\int_{x:g(x)\leq y}p_X(x)dx$$ 然后$p_Y=(y)=F’_Y(y)$
定理
若随机变量$X$的分布函数$F(x)$严格单调递增, 则随机变量$Y=F(X)$服从$[0,1]$上的均匀分布定理2.2
设随机变量$X$的可能取值范围为$(a,b)$, $X$的概率密度为$p(x)$,$a<x<b$(其中$a$可为$-\infty$, $b$可为$+\infty$), 设函数$y=(x)$处处可导, 且恒有$g’(x)>0$(或恒有$g’(x)<0$), 则$Y=g(X)$为连续型随机变量,其概率密度为
$$p_Y(y)=\begin{cases}
p_X[g^{-1}(y)]\cdot|[g^{-1}(y)]’| &\alpha<y<\beta\\
0 &其他
\end{cases}$$
其中$\alpha=\min\{g(a),g(b)\}$, $\beta=\max\{g(a),g(b)\}$, $g^{-1}(y)$为$y=g(x)$的反函数