TonyYin's Blog

Back

第三章:多维随机变量及其分布。

本章主要讨论两个或两个以上的随机变量。

二维随机变量

二维随机变量 (X,Y)(X, Y) 看作整体进行研究。

「联合分布函数」

定义二元函数:

F(x,y)=P{(Xx)(Yy)}=written asP{Xx,Yy}F(x, y)=P\{(X\leq x)\cap (Y\leq y)\} \xlongequal[]{\text{written as}}P\{X\leq x, Y\leq y\}

为二维随机变量 (X,Y)(X,Y)分布函数,或随机变量 XXYY联合分布函数

一些性质:

  • 关于 xxyy 单调不减。
  • 0F(x,y)10\leq F(x, y)\leq 1.
  • F(x,y)F(x, y) 关于 xx 右连续,关于 yy 右连续。
  • 对于任意 (x1,y1)(x_1, y_1), (x2,y2)(x2,y2), x1<x2x_1<x_2, y1<y2y_1<y_2,有:
F(x2,y2)F(x1,y2)F(x2,y1)+F(x1,y1)=P{x1<Xx2,y1<Yy2}0F(x_2, y_2)-F(x_1, y_2)-F(x_2, y_1)+F(x_1, y_1)=P\{x_1<X\leq x_2, y_1<Y\leq y_2\}\geq 0

「联合概率密度」

F(x,y)=yxf(u,v)dudvF(x, y)=\int_{-\infty}^{y}\int_{-\infty}^{x}f(u, v)\text{d}u\text{d}v

其中 f(x,y)f(x, y) 称为 (X,Y)(X, Y)概率密度,或 XXYY联合概率密度

一些性质:

  • f(x,y)0f(x,y)\geq 0

  • f(x,y)dxdy=F(,)=1\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f(x,y)\text{d}x\text{d}y=F(\infty,\infty)=1

  • P{(X,Y)G}=Gf(x,y)dxdyP\{(X, Y)\in G\}=\iint\limits_{G}f(x, y)\text{d}x\text{d}y.

  • 若在 (x,y)(x, y) 处连续,则:

    2F(x,y)xy=f(x,y)\frac{\partial^2F(x, y)}{\partial x\partial y}=f(x, y)

    用处是,可推知:

    P{x<Xx+Δx,y<Yy+Δy}f(x,y)ΔxΔyP\{x<X\leq x+\Delta x, y<Y\leq y+\Delta y\}\simeq f(x, y)\Delta x\Delta y

边缘分布

「边缘分布函数」

(X,Y)(X, Y) 的分布函数为 F(x,y)F(x, y),则 XX边缘分布函数为:

FX(x)=P{Xx}=limyF(x,y)=F(x,)F_X(x)=P\{X\leq x\}=\lim_{y\to \infty}F(x, y)=F(x, \infty)

即:

FX(x)=F(x,),FY(y)=F(,y)F_X(x)=F(x, \infty),\quad F_{Y}(y)=F(\infty,y)

「边缘概率密度」

fX(x)=f(x,y)dyf_X(x)=\int_{-\infty}^{\infty}f(x, y)\text{d}y fY(y)=f(x,y)dxf_Y(y)=\int_{-\infty}^{\infty}f(x, y)\text{d}x

二维正态分布

不是考察重点。

条件分布

讨论二维随机变量的条件概率分布。

离散型随机变量

离散型很好理解,跟普通的条件概率很像。

「条件分布律」

对于二维离散型随机变量 (X,Y)(X, Y),称:

P{X=xiY=yj}=P{X=xi,Y=yj}p{Y=yj}=pijpj,i=1,2P\{X=x_i \mid Y=y_j \}=\frac{P\{X=x_i,Y=y_j\}}{p\{Y=y_j\}}=\frac{p_{ij}}{p_{\cdot j}},\quad i=1,2\cdots

为在 Y=yjY=y_j 条件下随机变量 XX 的条件分布律。

连续型随机变量

对任意 x,yx,y 都有 P{X=x}=0,P{Y=y}=0P\{X=x\}=0,P\{Y=y\}=0,所以不能直接用条件概率公式,而是用极限定义如下:

(X,Y)(X, Y) 的概率密度为 f(x,y)f(x, y)(X,Y)(X, Y) 关于 YY 的边缘密度函数为 fY(y)f_Y(y),则有条件概率:

P{Xxy<Yy+ϵ}=P{Xx,y<Yy+ϵ}P{y<Yy+ϵ}=x[yy+ϵf(x,y)dy]dxyy+ϵfY(y)dyP\{X\leq x\mid y<Y\leq y+\epsilon\} =\frac{P\{X\leq x, y<Y\leq y+\epsilon\}}{P\{y<Y\leq y+\epsilon\}}=\frac{\int_{-\infty}^{x}[\int_{y}^{y+\epsilon}f(x,y)\text{d}y]\text{d}x}{\int_{y}^{y+\epsilon}f_{Y}(y)\text{d}y}

ϵ0\epsilon \rightarrow 0 时,可推得连续性随机变量的相关定义式,对于二维连续型随机变量 (X,Y)(X, Y),称:

「条件概率分布函数」

Fxy(xy)=P{XxY=y}=yf(x,y)fY(y)dxF_{x\mid y}(x\mid y)=P\{X\leq x\mid Y=y\}=\int_{-\infty}^{y}\frac{f(x, y)}{f_{Y}(y)}\text{d}x

「条件概率密度」

fxy(xy)=f(x,y)fY(y)f_{x\mid y}(x\mid y)=\frac{f(x ,y)}{f_{Y}(y)}

例题

P88:设随机变量 (X,Y)(X, Y) 的概率密度为:

f(x,y)={1,y<x,0<x<10,Otherwisef(x, y)=\left\{\begin{array}{rl} 1, & |y|<x, 0<x<1 \\ 0, & \text{Otherwise} \end{array}\right.

求条件概率密度 fYX(yx)f_{Y\mid X}(y\mid x)fXY(xy)f_{X\mid Y}(x\mid y).

先求 fXf_XfYf_Y

fX(x)=f(x,y)dy=xx1dy=2x(0<x<1)f_X(x)=\int_{-\infty}^{\infty}f(x, y)\text{d}y=\int_{-x}^{x}1\text{d}y=2x\quad (0<x<1) fY(y)=f(x,y)dx=y11dx=1y(y<1)f_Y(y)=\int_{-\infty}^{\infty}f(x, y)\text{d}x=\int_{|y|}^{1}1\text{d}x=1-|y|\quad (|y|<1)

之后求条件概率密度,

fYX(yx)=f(x,y)fX(x)=12x,(y<x,0<x<1)f_{Y\mid X}(y\mid x)=\frac{f(x, y)}{f_{X}(x)}=\frac{1}{2x},\quad (|y|<x, 0<x<1) fXY(xy)=f(x,y)fY(y)=11y,(y<x>1)f_{X\mid Y}(x\mid y)=\frac{f(x, y)}{f_{Y}(y)}=\frac{1}{1-|y|},\quad (|y|<x>1)

独立性

「定义」

P{Xx,Yy}=P{Xx}P{Yy}P\{X\leq x,Y\leq y\}=P\{X\leq x\}P\{Y\leq y\}

等价于:

F(x,y)=FX(x)FY(y)F(x, y)=F_X(x)F_Y(y)

**「连续型随机变量」**下式处处成立

f(x,y)=fX(x)fY(y)f(x, y)=f_X(x)f_Y(y)

**「离散型随机变量」**下式处处成立

P{X=xi,Y=yj}=P{X=xi}P{Y=yj}P\{X=x_i,Y=y_j\}=P\{X=x_i\}P\{Y=y_j\}

多个随机变量的分布

和的分布

Z=X+YZ=X+Y 的分布。

(X,Y)(X, Y) 是二维连续性随机变量,则 Z=X+YZ=X+Y 仍为连续性随机变量。

「分布函数」

FZ(z)=P{Zz}=x+yzf(x,y)dxdyF_{Z}(z)=P\{Z\leq z\}=\iint\limits_{x+y\leq z}f(x, y)\text{d}x\text{d}y

画图,转化为累次积分:

FZ(z)=dyzyf(x,y)dx=dyzf(uy,y)du=z[f(uy,y)dy]du\begin{aligned} F_{Z}(z) &=\int_{-\infty}^{\infty}\text{d}y\int_{-\infty}^{z-y}f(x,y)\text{d}x\\ &=\int_{-\infty}^{\infty}\text{d}y\int_{-\infty}^{z}f(u-y,y)\text{d}u\\ &=\int_{-\infty}^{z}[\int_{-\infty}^{\infty}f(u-y,y)\text{d}y]\text{d}u\\ \end{aligned}

「概率密度」

fX+Y(z)=f(zy,y)dyf_{X+Y}(z)=\int_{-\infty}^{\infty}f(z-y,y)\text{d}y

或同理可得:

fX+Y(z)=f(x,zx)dxf_{X+Y}(z)=\int_{-\infty}^{\infty}f(x,z-x)\text{d}x

「卷积公式」

XXYY 独立,则 f(x,y)=fX(x)fY(y)f(x, y)=f_{X}(x)\cdot f_{Y}(y),代入得到:

fX+Y(z)=fX(zy)fY(y)dyf_{X+Y}(z)=\int_{-\infty}^{\infty}f_X(z-y)f_{Y}(y)\text{d}y

fX+Y(z)=fX(x)fY(zx)dxf_{X+Y}(z)=\int_{-\infty}^{\infty}f_X(x)f_{Y}(z-x)\text{d}x

称为 fXf_{X}fYf_{Y}卷积公式,记为 fXfYf_{X}\ast f_{Y},是重要公式。

商的分布、积的分布

fY/X(z)=xf(x,xz)dxf_{Y/X}(z)=\int_{-\infty}^{\infty}\mid x \mid f(x,xz)\text{d}x fXY(z)=1xf(x,zx)dxf_{XY}(z)=\int_{-\infty}^{\infty}\frac{1}{\mid x \mid} f(x,\frac{z}{x})\text{d}x

XXYY 独立,也可以用上述类似的方式进行拆为两个函数的乘积,把 f(x,y)=fX(x)fY(y)f(x, y)=f_X(x)\cdot f_Y(y) 代入,

fY/X(z)=xfX(x)fY(xz)dxf_{Y/X}(z)=\int_{-\infty}^{\infty}\mid x \mid f_X(x)\cdot f_Y(xz)\text{d}x fXY(z)=1xfX(x)fY(zx)dxf_{XY}(z)=\int_{-\infty}^{\infty}\frac{1}{\mid x \mid} f_X(x)\cdot f_Y(\frac{z}{x})\text{d}x

Min / Max 分布

「二元情形」

先考虑二元情形 M=max{X,Y}M=\max\{X, Y\}N=min{X,Y}N=\min\{X, Y\} 的分布函数,其中 X,YX, Y 独立

由于 MM 是最大值,MzM\leq z 等价于 XXYYz\leq z,固有:

Fmax(z)=P{Mz}=P{Xz}P{Yz}=FX(z)FY(z)F_{\max}(z)=P\{M\leq z\}=P\{X\leq z\}P\{Y\leq z\}=F_{X}(z)\cdot F_{Y}(z)

类似可得 N=min{X,Y}N=\min\{X, Y\} 最小值的分布函数:

Fmin(z)=1P{X>z,Y>z}=1[1FX(z)][1FY(z)]F_{\min}(z)=1-P\{X>z,Y>z\}=1-[1-F_{X}(z)][1-F_{Y}(z)]

「多元情形」

下面推广到 nn 个独立随机变量的情况。

对于 nn 个相互独立的随机变量 X1,X2,,XnX1, X2, \cdots, X_n,有:

Fmax(z)=FX1(z)FX2(z)FXn(z).F_{\max}(z)=F_{X_1}(z)\cdot F_{X_2}(z)\cdots F_{X_n}(z). Fmin(z)=1[1FX1(z)][1FX2(z)][1FXn(z)].F_{\min}(z)=1-[1-F_{X_1}(z)]\cdot [1-F_{X_2}(z)]\cdots [1-F_{X_n}(z)].

Rayleigh 瑞利分布

(X,Y)N(0,0,1,1,0)(X,Y)\sim N(0,0,1,1,0),求 Z=X2+Y2Z=\sqrt{X^2+Y^2} 的分布。

f(x,y)=12πex2+y22f(x,y)=\frac{1}{2\pi}e^{-\frac{x^2+y^2}{2}}

「分布函数」

FZ(z)=P{x2+y2z2}=Df(x,y)dxdyF_Z(z)=P\{x^2+y^2\leq z^2\}=\iint\limits_{D}f(x, y)\text{d}x\text{dy}

计算积分:

FZ(z)=02πdθ0zf(rcosθ,rsinθ)rdr=02πdθ0z12πer22rdr=02π12πez22(1ez22)dθ=12πez22(1ez22)2π=1ez22\begin{aligned} F_Z(z)&=\int_{0}^{2\pi}\text{d}\theta\int_{0}^{z}f(r\cos\theta,r\sin\theta)r\text{d}r\\ &=\int_{0}^{2\pi}\text{d}\theta\int_{0}^{z}\frac{1}{2\pi}e^{-\frac{r^2}{2}}r\text{d}r \\ &=\int_{0}^{2\pi}\frac{1}{2\pi}e^{-\frac{z^2}{2}}(1-e^{-\frac{z^2}{2}})\text{d}\theta\\ &=\frac{1}{2\pi}e^{-\frac{z^2}{2}}(1-e^{-\frac{z^2}{2}})2\pi\\ &=1-e^{-\frac{z^2}{2}}\\ \end{aligned}

即:

FZ(z)={1ez22,z>00,z<0F_Z(z)=\left\{ \begin{array}{ll} 1-e^{-\frac{z^2}{2}}, &z>0\\ 0 ,&z<0 \end{array} \right.

**「概率密度」**对分布函数求导,得:

fZ(z)={zez22,z>00,z<0f_Z(z)=\left\{ \begin{array}{ll} ze^{-\frac{z^2}{2}}, &z>0\\ 0 ,&z<0 \end{array} \right.

例题

P89:设 XXYY 是两个相互独立的随机变量,其概率密度分别为:

fX(x)=1,0x1f_X(x)=1,\quad0\leq x\leq1 fY(y)=ey,y>0f_Y(y)=e^{-y},\quad y>0

求随机变量 Z=X+YZ=X+Y 的概率密度。

首先要画图,并且考虑 ZZ 的取值,需满足:

{yzy+1,y>0\left\{\begin{array}{l} y\leq z\leq y+1,\\ y>0 \end{array}\right.

图形为:

image-20250415143825783

利用公式积分:

fZ(z)=fX(zy)fY(y)dyf_Z(z)=\int_{-\infty}^{\infty}f_X(z-y)f_Y(y)\text{d}y fZ(z)={0z1eydy=1ez,0<z<1z1z1eydy=(e1)ez,z10,Otherwisef_Z(z)=\left\{\begin{array}{ll} \displaystyle \int_{0}^{z}1\cdot e^{-y}\text{d}y=1-e^{-z}, &0<z<1\\ \displaystyle \int_{z-1}^{z}1\cdot e^{-y}\text{d}y=(e-1)e^{-z}, &z\geq 1\\ 0,&\text{Otherwise} \end{array}\right.
多维随机变量及其分布
https://www.tonyyin0418.com/blog/probability/chap-3
Author TonyYin
Published at April 8, 2025
Comment seems to stuck. Try to refresh?✨