二维随机变量及其分布

E 是一个随机试验,Ω 是其样本空间,若对 Ω 中的任意一个样本点 ω,按照一定的对应法则,存在一对实数 (X(ω),Y(ω)) 与之对应,简记为 (X,Y),则称 (X,Y)二维随机变量

例如学生对应 ωX(ω) 对应其高数成绩,Y(ω) 对应其概统成绩。

(X,Y) 为二维随机变量,对于任意实数 x,y,称定义在实平面上的二元函数 F(x,y)=P({Xx}{Yy})=P(Xx,Yy) 为二维随机变量 (X,Y)联合分布函数,简称为分布函数或联合分布。

二维前缀和

其性质:

设二维随机变量 (X,Y) 的分布函数为 F(x,y),分量 XY 也都是随机变量,各自的分布函数分别记为 FX(x)FY(y),并依次称为随机变量 (X,Y) 关于 XY边缘分布函数.

由分布函数的定义可得联合分布函数和边缘分布函数的关系,

FX(x)=P(Xx)=P(Xx,Y+)=F(x,+)

同理可得

FY(y)=F(+,y)

一般地,我们可以根据分布函数求边缘分布函数 FX(x)FY(y)反之不然.

二维离散型随机变量及其分布律

定义

随机变量 (X,Y) 在二维平面上所有可能的取值为有限对或 可列 无穷对,则称 (X,Y)二维离散型随机变量。(和一维的情况差不多)

设二维随机变量 (X,Y) 的所有可能取值为 (xi,yj)i,j=1,2,,则称 P(X=xi,Y=yj)=piji,j=1,2, 为二维离散型随机变量 (X,Y) 的联合分布律或联合分布列,简称为 分布律

image-20231009211739684

容易看出分布律具有如下性质:

若某数列 pij(i,j=1,2,) 满足上述两条性质,就可以作为某个二维离散型随机变量的分布律。

分布律和分布函数的关系

二维离散型随机变量的分布函数与分布律互为确定,其分布函数可按下式求得:

F(x,y)=xixyiypij

容易知道,二维离散型随机变量的两个分量均为离散型随机变量,且其分布律分别如下所示:

P(X=xi)=jipijpi,i=1,2,P(Y=yj)=ipijpj,j=1,2,

分别称 P(X=xi)P(Y=yj)(X,Y) 关于 X 和关于 Y边缘分布律

二维连续型随机变量

定义:对于二维随机变量 (X,Y) 的分布函数 F(x,y),如果存在一个二元 非负可积 函数 f(x,y),使得对于任意一对实数 (x,y),有

F(x,y)=xyf(u,v)dudv

成立,则称 (X,Y) 为二维连续型随机变量,并称 f(x,y)(X,Y)联合概率密度函数,简称联合概率密度或联合密度。满足以下性质:

若二元函数 f(x,y) 满足以上两条性质,就可以作为某个二维随机变量 (X,Y) 的联合概率密度。可以用于计算落于某区间 D 的概率:

P((X,Y)D)=Df(x,y)dxdy

f(x,y)连续点 处,有:

2F(x,y)xy=f(x,y)

边缘概率密度函数

fX(x)=+f(x,y)dyfY(y)=+f(x,y)dx

二维均匀分布

如果二维随机变量 (X,Y) 在二维有界区域 G 上取值,且它的联合概率密度为

f(x,y)={1G,(x,y)G;0,else.

则称 (X,Y) 服从 G 上的均匀分布。

二维正态分布

如果二维随机变量 (X,Y) 的联合概率密度为

f(x,y)=12πσ1σ21ρ2exp{12(1ρ2)[(xμ1)2σ122ρ(xμ1)(yμ2)σ1σ2+(yμ2)2σ22]}

其中 μ1,μ2,σ1,σ2,ρ 为常数,则称 (X,Y) 服从二维正态分布,记为:

(X,Y)N(μ1,σ12;μ2,σ22;ρ)

通过积分得边缘概率密度为:

fX(x)=12πσ1e(xμ1)22σ12,fY(y)=12πσ2e(xμ2)22σ22

所以 XN(μ1,σ12),YN(μ2,σ22)——不依赖于参数 ρ.

因此,仅有关于 XY 的边缘分布,一般来说不能确定随机变量 (X,Y) 的联合分布。

验证 ρ=0X,Y 相互独立?只需要验证 f(x,y)=fX(x)fY(y).


通过联合概率密度函数:

f(x,y)=12πe(x2+y2)/2(1+sinxsiny),<x<+,<y<+

求边缘概率密度 fX(x)fY(y).

由边缘概率密度的公式,可以得到:

fX(x)=+12πe(x2+y2)/2(1+sinxsiny)dy=12πex2/2+ey2/2dy=12πex2/2

甚至可以加上这种相互抵消的部分,原因是 ey2/2siny奇函数

已知 X,Y 都服从正态分布,那么 (X,Y) 是不是一定服从二维正态分布?不一定,就像这题可以叠加一个奇函数之类的东西。

二维随机变量的条件分布

例如,研究儿童发育情况,需要了解在给定身高下体重的分布、给定体重下身高的分布。

二维离散型随机变量的条件分布

设有二维离散型随机变量 (X,Y),对于固定的 j,若 P(Y=yi)>0,则称

P(X=xiY=yi)=P(X=xi,Y=yi)P(Y=yi)=pijpj,i=1,2,

为在 {Y=yi} 的条件下 X 的条件分布律。

满足的性质:

二维连续型随机变量的条件分布

在连续型的情况下,P(X=xi,Y=yi)P(Y=yi) 都为零,因此不能这么计算。

引入:设平面区域 G={(x,y)x2+y2r2},求条件概率密度 fXY(xy).

r<x<r 的情况下,当 x 给定,随机变量 Y(r2x2,r2+x2) 内服从均匀分布,因此

fYX(yx)={12r2x2,r2x2<y<r2x2,0,,

可以得到:

fXY(xy)=f(x,y)fY(y)

如何理解,在 fY(y) 的这么多情况中,取到 f(x,y) 的概率。

称:

FXY(xy)=xfXY(uy)du=xf(u,y)fY(y)du

为在 Y=y 条件下 X 的条件分布函数。


这个公式反过来用,可以通过条件概率密度函数和边缘分布函数计算得到联合分布概率密度函数。

f(x,y)=fXY(xy)fY(y)

image-20231019091738061

如果画图,很容易得出是在 Y>0 的面积中 X>1/2,Y>0 的部分所占的比例。

随机变量的独立性

可能出现这样的分布,其中 X 的取值不影响 YY 的取值也不影响 X,这种情况 X,Y 相互独立,这里给出两个随机变量相互独立的定义:


如果相互独立,则:

fX(x)=fXY(xy)fY(y)=fYX(yx)

是因为 fXY(xy)=f(x,y)/fY(y)=fX(x).


如果 X,Y 相互独立,g(x)h(y) 是两个确定函数,则 g(X)h(Y) 也相互独立。

image-20231027200020006

计算出:

P(X=1,Y=n),P(X=0,Y=n);P(X=1),P(X=0);P(Y=n)

验证相乘结果即可。


image-20231027200657069

先计算边缘分布函数:

对于 (1):

fX(x)=x216xydy=3x(1x4)for1<x<1fY(y)=0y6xydx=3y2for0<y<1

因此显然不独立。

对于 (2):

可以发现 f(x,y)=2x2y,应该是独立的。


独立性定理(X,Y) 是二维连续型随机变量,f(x,y)(X,Y) 的联合概率密度,则 XY 相互独立的充分必要条件是存在非负可积函数 r(x)g(y),使得:

f(x,y)=r(x)g(y)

在一切连续点上成立,此时:

fX(x)=r(x)+r(x)dx,fY(y)=g(y)+g(y)dy

n 维随机变量

分布函数的定义(X1,X2,,Xn)n 维随机变量,对于任意 x1,x2,xnR,称 F(x1,x2,,xn)=P(X1x1,X2x2,,Xnxn)n 维随机变量 (X1,X2,,Xn)联合分布函数

k 维边缘分布函数 (X1,X2,,Xn) 里面取 k 个变量,构成的边缘分布函数。

独立性 联合分布函数等于一维边缘分布函数的乘积。

n 离散型随机变量 当变量的取值有限或可列时,称为离散型随机变量。

独立性 P(X1=x1,X2=x2,,Xn=xn)=P(X1=x1)P(X2=x3)P(Xn=xn).

image-20231027202720668

独立性 n 维随机型连续随机变量 (X1,X2,,Xn)n 个分量相互独立的充分必要条件是:在任意连续点 (x1,x2,,xn) 处有:

f(x1,x2,,xn)=fX1(x1)fX2(x2)fXn(xn)

其中 x1,x2,,xnR.

多维随机变量函数的分布

多维离散型随机变量函数的分布

假设确定了 XY 的分布,如何确定 Z=X+Y 的分布?

P(Z=r)=P(X+Y=r)=i=0rP(X=i,Y=ri)

进一步,当 XY 相互独立时,则

P(Z=r)=i=0rP(X=i)P(Y=ri)

如果对 Poisson 分布分析,假设 X1,X2P(λ)X=X1+X2,则:

P(X=r)=i=0rP(X1=i)P(X2=ri)=i=0rλii!eλλri(ri)!eλ=e2λi=0rλri!(ri)!=e2λ1r!i=0rCriλr=λr(1+1)rr!e2r=(2λ)rr!e2rP(2λ)

因此,Poisson 分布具有可加性,即 XP(λ1),YP(λ2),则 X+YP(λ1+λ2).

同理,二项分布也具有可加性,即 XB(n,p),YB(m,p),则 X+YB(n+m,p).

多维连续型随机变量函数的分布

正态随机变量的分布

(X,Y)N(μ1,σ12,μ2,σ22,ρ),则:

X+YN(μ1+μ2,σ12+2ρσ1σ2+σ22)

特别地,若 X,Y 相互独立,则 ρ=0,……

X1,X2,,Xn 相互独立,XiN(μi,σi2),i=1,2,,n,则:

i=1nXiN(i=1nμi,i=1nσi2)

和的分布 Z=X+Y

XY 的联合密度为 f(x,y),求 Z=X+Y 的概率密度?

从分布函数的定义出发,先去求分布函数,然后再求导。

FZ(z)=P(Zz)=P(X+Yz)=+dxzxf(x,y)dy

可以得到:

fZ(z)=+f(x,zx)dx

或:

fZ(z)=+f(zy,y)dy

直观理解:一条线 x+y=z 上的概率。

推广Z=aX+bY+c 的概率密度?沿用相同的思路,直线是 z=ax+by+c,固定 x,则

y=zaxcb

因此,

fZ(z)=1|b|y+f(x,zaxcb)dx

image-20231027210323354

首先,可以判断出独立分布,然后代入公式:

fZ(z)=+f(x,zx)dx

0<z<1x(0,z) 的时候 f(x,y)=1,因此 fZ(z)=z.

1z<2x(z1,1) 时候 f(x,y)=1,因此 fZ(z)=2z.

其余?fZ(z)=0.


商的分布 Z=X/Y

FZ(z)==x/yzf(x,y)dxdy

重点是积分区域怎么画?将 z 看为常数,则积分区域为:

image-20231027211614862

分为两部分考虑:

=0+(yzf(x,y)dx)dy+0(yz+f(x,y)dx)dy

然后再对 z 求导:

=0+f(yz,y)ydy0f(yz,y)ydy=+f(yz,y)|y|dy

平方和的分布 Z=X2+Y2

先讨论 z0 的情况:

FZ(z)=x2+y2zf(x,y)dxdy

x=rcosθ,y=rsinθ,dxdy=rdrdθ.

则替换后,形成:

02πdθ0zf(rcosθ,rsinθ)rdr

z 求导:

fZ(z)=02πdθ12f(zcosθ,zsinθ)

然后,z<0 的情况,显然 fZ(z)=0.

例题:XN(0,1),YN(0,1)X,Y 相互独立,Z=X2+Y2,则:

f(X=x)=12πex2/2
fZ(z)=02πdθ1212πez2/2=12ez2/2

(当 z0

服从自由度为 2 的 χ2 分布,卡方分布.


极值分布

设连续随机变量 X,Y 相互独立,分布函数分别为 FX(x),FY(y),令 M=max{X,Y}N=min{X,Y},求 M,N 的分布函数。

还是先求分布函数,

FM(z)=P(max{X,Y}z)=P(Xz,Yz)=P(Xz)P(Yz)

所以:

FM(z)=FX(z)FY(z)
FN(z)=P(min{X,Y}z)=1P(min{X,Y}>z)=1(1FX(z))(1FY(z))

image-20231027231533366

image-20231027231656411

串联取决于最短的寿命,并联取决于最长的寿命。分布服从指数分布:

FXi(xi)=1eλxi,xi>0;0,xi0

因此,

FX(z)=1i=1n(1FXi(z))=1eλnz
fX(z)E(nλ)
FX(z)=(1eλz)n
fX(z)=nλeλz(1eλz)n1

当然,这里的条件全部都是 x>0. 否则概率为零。


image-20231027232515279

这里讨论 z>0 的情况。注意 x,y 的范围:

FZ(z)=P(Zz)=P(XYz)=0+dx0z/xf(x,y)dy

求导之后得到:

fZ(z)=0+xe(z+x)dx

多维随机变量函数的联合分布

image-20231027233331878

往年试题

21-4

image-20231205163738201

为什么不相关:E(XY)=0(对称)E(X)=E(Y)=0(对称)