随机变量及其分布函数

随机变量

将样本空间中的每一个事件 ω 按照一定的的法则 X 对应到一个实数,则称 Ω 上的单值实值函数 X(ω)随机变量

随机变量是 ΩR 上的一个映射:

分布函数

X 为一随机变量,对于任意实数 x,称 F(x)=P(Xx),<x<+X分布函数

分布函数的性质:

Xx0 的概率:

P(X=x0)=limΔx0+P(x0Δx<Xx0)=limΔx0+[F(x0)F(x0Δx)]=F(x0)F(x00)

X1,X2 相互独立,分布函数分别为 F1(x),F2(x),则 F1(x)F2(x) 必为某一随机变量 X=max{X1,X2} 的分布函数。

证明,

P(X=x0)=limΔx0+[F1(x0)F2(x0)F1(x0Δx)F2(x0Δx)]=limΔx0+F1(x0)(F2(x0)F2(x0Δx))+limΔx0+F2(x0Δx)(F1(x0)F1(x0Δx))=F1(x0)P(X2=x0)+F2(x0)P(X1=x0)=P(X1x0)P(X2=x0)+P(X2x0)P(X1=x0)=P(max{X1,X2}=x0)

也可以:

F(x0)=P(Xx0)=P(max(X1,X2)x0)=P(X1x0)P(X2x0)=F1(x)F2(x)

F1(X)F2(X) 是分布函数,则 F(X)=aF1(X)+bF2(x) 是分布函数的充要条件是 a+b=1.

离散型随机变量及其分布律

离散型随机变量概率分布的一般概念

设离散型随机变量 X 的所有可能取值为 X=xk(k=1,2,),不妨设 x1<x2<,称

P(X=xk)=pk,k=1,2,

X分布律,满足 pk0,k=1,2,k=1+pk=1.

离散型随机变量分布函数和分布律的关系

常见的离散型随机变量

0-1 分布

X10
Pp1p

也可以写成

P(X=k)=pk(1p)1k,k=0,1.

二项分布(Bernoulli 分布)

Bernoulli 试验

n 重 Bernoulli 试验的分布律:

P(X=k)=Cnkpk(1p)nk

定义最可能成功次数k,满足:

P(X=k)P(X=j),j=0,1,,n

则称 kn 次独立实验中最可能成功次数,在一般情况下:


访客对广告的点击率为 pX 表示点击这个广告(第) r 次时该网站的访问量,写出 X 的分布律。

最后一次一定完成点击,因此

P(X=k)=Ck1r1pr1(1p)krp=Ck1r1pr(1p)kr

称为 负二项分布

r=1 时(第一次点击),有

P(X=k)=(1p)k1p,k=1,2,,

称为 几何分布

Poisson 分布

将某一时间段划分为 n 段,每一时间段发生事件的概率和时间段的时长成正比,不妨记作 λn,那么这段发生事件数目的数量 X 满足二项分布:

XB(n,λn)

n 时,

limn+P(Xn=k)=limnCnk(λn)k(1λn)nk=limnn!k!(nk)!λk(nλ)nknn

使用 Stirling 公式证明:

Stirling 公式:n!2πn(ne)n,n. ……

代入化简得到

limnn!k!(nk)!λk(nλ)nknn=limn2πn(ne)nk!2π(nk)(nke)nkλk(nλ)nknn=limnλkk!ek(nλnk)nk

接下来计算:

limn(nλnk)nk

换元 m=nk

limm(m(λk)m)m=ekλ

于是得到最终:

limnP(Xn=k)=limnCnkpk(1p)nk=λkk!eλ

实际计算可以拿这个公式做近似。


设随机变量 X 的所有可能取值为 0,1,2,,并且分布律为:

P(X=k)=eλλkk!,k=0,1,2,

其中 λ>0,则称随机变量 X 服从参数为 λ 的 Poisson 分布,记为 XP(λ). 也就是:

XB(n,λn)n+XP(λ)

image-20230923111822924

即计算

P(Y=k)=m=kP(X=m)Cmkpk(1p)mk=m=keλλmm!m!k!(mk)!pk(1p)mk=mkeλpkλkk!m=kλmk(mk)!(1p)mk

接下来换元 mk=l,求:

l=0λll!(1p)l=l=0[λ(1p)]ll!

这其实是一个级数的形式,因为 ex=i=0xii!, 所以上式等于 eλ(1p).

然后最后化简得到

P(Y=k)=eλp(λp)kk!YP(λp)

直觉上很好理解。

连续型随机变量及其概率密度

概率密度函数及其性质

概率密度函数由分布函数定义.

X 是一随机变量,F(x) 是其分布函数,若存在一个非负可积函数 f(x),使得:

F(x)=xf(t)dt,<x<+

则称 X连续型随机变量f(x) 是它的 概率密度函数,满足以下性质:

常见的连续型随机变量

均匀分布

满足

f(x)={1ba,a<x<b0,else

记为,XU(a,b).

分布函数为:

F(x)={xba,a<x<b0,else

指数分布

满足

f(x)={λeλx,x>00,x0

记为,XE(λ).

分布函数为:

F(x)={1eλx,x>00,x0

如果在单位时间内出现的质点数符合 Poisson 分布,则任意两个质点出现的时间间隔服从指数分布。

正态分布

满足

f(x)=12πσe(xμ)22σ2,<x<+

其中 μ,σ 为常数,σ>0,则称 X 服从参数为 μ,σ 的正态分布,记为 XN(μ,σ2)

特点:

参数 μ=0,σ=1 称为 标准正态分布。这里记为 XN(0,1),概率密度为

φ(x)=12πex2/2,<x<+

分布函数:

Φ(x)=12πxet2/2dt,<x<+

一般的正态分布可以通过线性变换 Y=Xμσ 转换为标准正态分布。还具有以下性质(由图像得出)

推出:

随机变量函数的分布

离散型随机变量的分布

问题:求 Y=g(X) 的概率特性。

一般地, 随机变量 X 为离散型随机变量,其分布律为:

P(X=xk)=pk,k=1,2,

又设函数 y=g(x),求 Y=g(X) 的概率分布的一般方法如下:


已知随机变量 X 的概率分布律为:

P(X=kπ2)=pqk,k=0,1,2,

其中 p+q=1,0<p<1,求随机变量 Y=sinX 的概率分布,

P(Y=1)=m=0P(X=(4m+3)π2)=m=0pq4m+3=pq31q4
P(Y=0)=m=0P(X=2mπ2)=p1q2
P(Y=1)=m=0P(X=(4m+1)π2)=m=0pq4m+1=pq1q4

连续型随机变量函数的分布

一般地,设 X 为连续型随机变量,如果已知 X 的概率密度为 fX(x)(或分布函数),又设函数 y=g(x),求 Y=g(X) 的概率密度(或分布函数)的步骤如下:

也就是:

fX(x)FX(x)FY(y)fY(y)
1.FY(y)=P{Yy}=P{g(X)y}=g(x)yfX(x)dx2.fY(y)=FY(y)

注意范围需要讨论。


Problem:气体分子的运动速度 X 是一个随机变量,其概率密度为:

fX(x)={4x2σ3πex2σ2,x>0,0,x0,

Y=12mX2 表示分子的动能,求随机变量 Y 的概率分布。

Solution

FY(y)=P(x2ym)=02ym4x2σ3πex2σ2dx(y>0)
fY(y)=dFY(y)dy

image-20231007142436840

这个例子的应用:设 XN(μ,σ2),则:

fY(y)=1|a|fX(yba)=12πσ|a|eybaμ22a2σ2

YN(aμ+b,a2σ2).


image-20231007200758361

P(X=x)=12πex2/2,FX(x)

y>0

FY(y)=P(Yy)=P(|X|y)=2FX(y)1

y0

FY(y)=0
fY(y)=FY(y)=212y12πey/2,y>0;0,y0

image-20231007201233921

先求 FX(x)

FX(x)={0,x0x2π2,0<x<π1,xπ
FY(y)=P{Yy}=P{sinXy}=FX(arcsiny)+(1FX(πarcsiny))
fY(y)=FY(y)=11y22arcsinyπ2+11y22(πarcsiny)π2=11y22ππ2=2π1y2

for 0<y<1, 其他情况 fY(y)=0.


image-20231007202747534

image-20231007202758859


image-20231007203424333


一般性结论:

设随机变量 X 具有概率密度 fX(x),<x<+g(x),+ 内的严格单调递增(或递减)的可导函数,则随机变量 Y=g(X) 的概率密度为:

fY(y)={|h(y)|fX[h(y)],α<y<β0,else

其中 h(y)g(x) 的反函数,α=min{g(),g(+)},β=max{g(),g(+)}.

往年题目

18-10

image-20231222173801089

首先,因为 X,Y 相互独立,由泊松分布的可加性,有:

X+YP(λ+μ)

因此:

P(X+Y=n)=e(λ+μ)(λ+μ)nn!

而:

P(X=iX+Y=n)=P(X=i)P(Y=ni)P(X+Y=n)=eλλii!eμμni(ni)!e(λ+μ)(λ+μ)nn!=Cniλiμni(λ+μ)n