数学期望

数学期望的概念

离散型随机变量 X 的分布律为:

Xx1x2xk
Pp1p2pk

若级数 k=1+xkpk 绝对收敛,则称:

E(X)=k=1+xkpk

Q: 为什么要求绝对收敛?即 k=1|xk|pk<+.

不是绝对收敛的情况,例如 xk=2k,pk=1/2kxk=(2)k,pk=1/2k,则数学期望不存在。

要求级数绝对收敛,是为了保证 E(X)X 取值的排列次序无关。

X连续型随机变量,其概率密度为 f(x),若 +xf(x)dx 绝对收敛,则称:

E(X)=+xf(x)dx

可以转化为离散的形式加以解释。

注:数学期望又称均值,反应了随机变量取值的平均值,是一种加权平均。

注:E(X) 是一个确定的数,因此叫做数学特征。

Q: 求 Poisson 分布 的期望:

P(X=k)=λkk!eλ
E(X)=kP(x=k)=k=1+kλkk!eλ

法1:使用级数求和:

=λeλk=1+λk1(k1)!=λ

法2:使用 Poisson 分布的规范性:

=λk=1+λk1(k1)!eλ=λk=1+P(X=k1)=λ

Q:求 几何分布 的期望:

P(X=k)=pqk1,p+q=1,k=1,2,
E(X)=k=1+kpqk1=pk=1+kqk1=p(k=1+qk)=p1(1q)2=1p

Q: 求 指数分布 的期望:

f(x)={λeλx,x>00,x0
E(X)=0+λeλxx=0+xdeλx=[xeλx]0++0+eλxdx=1λ

Q: 电子元器件的寿命服从指数分布,求三个串联 or 三个并联的数学期望。极小值分布 and 极大值分布

N=min{X1,X2,X3},服从参数为 3λ 的指数分布,E(N)=1/3λ.

M=max{X1,X2,X3},先求出分布函数,再求出概率密度函数,然后再积分。

Q: 说明对于 Cauchy 分布:

fX(x)=1π11+x2,<x<+

X 的数学期望不存在

+|x|f(x)dx=2π0+x1+x2dx=1πln(1+x2)|0+=

随机变量函数的数学期望

定义:设 X 为随机变量,Y=g(X),其中 g(x) 是一个确定函数.

  1. X 为离散型随机变量,若级数 k=1+g(xk)pk 绝对收敛,则:

    E(Y)=E[g(X)]=k=1+g(xk)pk
  2. 对于连续型,若积分……收敛,则:

    E(Y)=E[g(X)]=+g(x)f(x)dx

对于二元函数,也是类似的。

Q: 求二维离散型随机变量的期望。

E(X)=E(g(X,Y))=ijg(xi,yi)pij=ig(xi,yi)pi

因此是边缘函数的期望。再求 E(XY),也很简单。

求期望:

Q: 求二维连续型随机变量的期望。

f(x,y)={14x(1+3y2),0<x<2,0<y<1;0,else.

E(X)?

E(X)=++xf(x,y)dxdy=+x+f(x,y)dydx=+xfX(x)dx

E(X+Y)=E(X)+E(Y).

E(XY)? 当 X,Y 独立,f(x,y)=fX(x)fY(y). 推出:E(XY)=E(X)E(Y).

E(Y/X)? 没有特殊的结论……

例题:设产品需求量为 X 吨,XU[2000,4000],每出售一吨可以赚 3w, 每剩下一顿需要付 1w 仓库管理费。使得赚的钱的期望 E(Y) 最大。

E(Y)=2000y(3x(yx))12000dx+y40003y12000dx
ddyE(Y)==0

数学期望的性质

例题:验血方案的选择,对 n 人监测,已知患病率 p,每个人患病与否相互独立,说明哪一种方法比较经济:

对于第一种方案,化验次数为 n,对于第二种方案,分为 t=n/k 组,第 i 组平均化验次数:

p11+k
Xi(1p)k1(1p)k
E(Xi)=(1p)k+(1+k)(1(1p)k)=1+k(1(1p)k)

每组(Xi)化验结果相互独立,则:

E(X)=iE(Xi)=t+tk(1(1p)k)+1+(ntk)(1(1p)ntk)

所以比较这个和 n 的大小。

方差

方差的概念

引入,两个资产收益分布为 X1N(8,4),X2N(8,9),我们希望选择收益稳定的。

定义X 是随机变量,若 E[(XE(X))2] 存在,则称其为随机变量 X方差,记为 D(X). 标准差 记为 σX=D(X)

|XE(X)|(XE(X))2E[],变成期望,方便比较。

离散型

D(X)=k=1(xkE(X))2pk

连续型

D(X)=+(xE(x))2f(x)dx

还可以用计算公式 D(X)=E(X2)E(X)2.

Why?

D(X)=E[(XE(X))2]=E(X22XE(X)+E(X)2)=E(X2)2E(X)E(X)+E(X)2=E(X2)E(X)2

注意证明时,E(X) 可以看作常数,利用期望的线性性。


Poisson 分布的方差。设 XP(λ),求 D(X).

由上面的推导,E(X)=λ,现在只用求 E(X2) 即可。

E(X2)=k=0k2λkk!eλ=k=0kλkk!eλ+k=0k(k1)λkk!eλ=λ+λ2k=2λk2(k2)!eλ=λ+λ2
D(X)=E(X2)E(X)2=λ

正态分布的方差。设 XN(μ,σ2),求 D(X).

观察到

f(x)=12πσe(xμ)2/2σ2
D(x)=+(xμ)2f(x)dx

(xμ)/σ=t,得到:

=+σ2t212πet2/2dt=σ2

热水器实际使用寿命 X,用户使用的寿命 Y,则 Y=min{X,m}.

E(Y)=0mxλeλxdx+m+mλeλxdx
E(Y2)=0mx2λeλxdx+m+m2λeλxdx

利用方差的计算公式……

归根结底还是随机变量函数的期望

方差的性质


XN(1,3),YN(2,4),且 X,Y 相互独立,求 Z=2X3Y 服从的分布。

ZN(26,12+36)=N(4,48)

XB(n,p),求 D(X). 可以转换为 n 次 0-1 分布。

引入随机变量 Xi 代表第 i 次事件是否发生,则

E(Xi)=pD(Xi)=p(1p)2+(1p)p2=p(1p)

因此,E(X)=np,D(X)=np(1p).


帕斯卡分布:设 X 表示独立射击直到击中目标 r 次位置所需要的射击次数,设每次击中概率为 p,求 E(X),D(X).

可以拆分成 r 个几何分布,这些分布还是独立的。

P(X=k)=Ck1r1pr(1p)krk=r,r+1,

X1,,Xr 独立,XiG(p).

其中:

P(Xi=k)=(1p)k1p
E(Xi)=k=1+k(1p)k1p=1p
E(Xi2)=2pp2

(利用求导)

D(Xi)=1pp2

所以:

E(X)=E(Xi)=rpD(X)=D(xi)=r(1p)p2
分布表达式期望方差
0-1分布P(X=k)=pk(1p)1k,k=0,1.pp(1p)
B(n,p): n 个 0-1P(X=k)=Cnkpk(1p)nknpnp(1p)
P(λ)P(X=k)=eλλkk!,k=0,1,2,λλ
G(p)P(X=k)=(1p)k1p,k=1,2,1/p(1p)/p2
Pascal 分布: r 个几何P(X=k)=Ck1r1prqkr,k=r,r+1,r/pr(1p)/p2
U(a,b)1/(ba) 对于 x[a,b],其余为零(a+b)/2(ba)2/12
E(λ)λeλx 对于 x>0,其余为零1/λ1/λ2
N(μ,σ2)f(x)=12πσe(xμ)22σ2,<x<+μσ2

标准化随机变量

引入,XN(μ,σ2)xμσN(0,1).

设随机变量 X 的期望 E(X)D(X) 都存在,且 D(X)>0,则称:

X=XE(X)D(X)

X 的标准化随机变量。

E(X)=0.

D(X)=D(XE(X))D(X)=1 因为 E(X) 为常数。

Y=aX+b,(a>0),则 X,Y 标准化得到的随机变量相同。若 a<0,则 Y=X.

已知分布的类型,分布的期望和方差,就可以得到分布的表达式。

协方差

协方差的概念

若期望 E((XE(X))(YE(Y))) 存在,则称为 X,Y 的协方差。

记为:

cov(X,Y)=E((XE(X))(YE(Y)))

协方差的计算公式:

cov(X,Y)=E(XY)E(X)E(Y)

定义D(X)>0,D(Y)>0,称:

ρXY=cov(X,Y)D(X)D(Y)

X,Y 的相关系数。

相关系数的本质是“标准化”了的协方差,即 ρXY=cov(X,Y),其中 X,YX,Y 标准化随机变量。是因为:

ρXY=E((XE(X))(YE(Y))D(X)D(Y))=E(XY)0=cov(X,Y)

分析特殊情况 Y=aX+b(a>0),则:

cov(XY)=E((X)2)=D(X)=1

a<0,则 cov(XY)=1.

Cauchy-Schwarz 不等式 |cov(X,Y)|D(X)D(Y).

等号取到相当于 YX 有线性关系:P(Y=±X)=1.

或者按照书上的定义:存在常数 t0,使得:

P(YE(Y)=t0(XE(X)))=1

协方差和相关系数的性质

相关系数的性质

  1. |ρXY|1.

  2. |ρXY|=1 的充要条件为 P(Y=±X)=1,并且

    1. ρXY=1 的充要条件为 P(Y=X),此时称 X,Y 完全正相关;

    2. ρXY=1 的充要条件为 P(Y=X),此时称 X,Y 完全负相关。

注:我们可以推导出 mina,bE[(YaXb)2]=D(Y)(1ρXY2)。即 |ρXY| 越接近 1,线性均方误差越小。

XY 不相关的等价命题

设随机变量 XY 的方差都存在,且 D(X)>0D(Y)>0,则下列命题等价:

  1. XY 不相关;

  2. ρXY=0, cov(X,Y)=0, E(XY)=E(X)E(Y). 这三者的等价关系可以从表达式得出。

  3. D(X±Y)=D(X)+D(Y).

  4. D(X+Y)=D(XY).

XY 相互独立

P(XY)=P(X)P(Y)

但是二维正态分布,X,Y 不相关、独立都等价于 ρ=0,因此是等价的。

随机变量的高阶矩

Q: D(X) 描述了 X 和自身相比偏离中心的程度,cov(X,Y) 描述了 XY 相比偏离程度,如果有 n 个随机变量,怎么度量它们之间的相互关系?

X,Y 都是随机变量. 定义(混合)原点矩/中心矩

  1. E(|X|k)<+(k=1,2,),则称 E(Xk)Xk 阶原点矩,E{[XE(X)]k}Xk 阶中心矩;

  2. E(|X|k|Y|l)<+(k,l=1,2,),则称 E(XkYl)X,Yk+l 阶混合原点矩,E{[XE(X)]k[YE(Y)]l}Xk+l 阶混合中心矩。

E(X)X 的一阶原点矩,D(X)X 的二阶中心矩,cov(X,Y)X,Y 的二阶混合中心矩。

定义 协方差矩阵,设 (X1,X2,,Xn)n 维随机变量,X1,X2,,Xn 的二阶矩都存在,记 cij=cov(Xi,Xj),i,j=1,2,,n,则称矩阵:

C=(c11c12c1nc21c22c2ncn1cn2cnn)

n 维随机变量 (X1,X2,,Xn) 的协方差矩阵。由于 cij=cji,因此是 对称矩阵

对于任意实数 t1,t2,,tn,有:

D(t1X1+t2X2++tnXn)=cov(i=1ntiXi,j=1ntjXj)=i=1nticov(Xi,j=1ntjXj)=i=1nj=1ntitjcov(Xi,Xj)=i=1nj=1ntitjcij=(t1,t2,,tn)C(t1,t2,,tn)

由于 D()0,所以 C半正定矩阵

定义 n 维正态分布:设 (X1,X2,,Xn)n 维随机变量,如果 (X1,X2,,Xn) 的联合概率密度满足:

f(x1,x2,,xn)=1(2π)1/2|C|1/2e12(xμ)C1(xμ)

(X1,X2,,Xn)N(μ,C).

X1,X2,,Xn 相互独立的充要条件是协方差矩阵 C 为对角阵,此时若 ijcov(i,j)=0……

往年试题

19-3

image-20231115093428170

A 利用协方差的性质:

cov(X1,X)=cov(X1,1nX1+1ni=2nXi)=1nD(X1)+1ni=2ncov(X1,Xi)

对于 i2,因为 X1,Xi 独立,所以 X1,Xi 不相关,cov(X1,Xi)=0.

因此,cov(X1,X)=σ2/n.

再计算 C:

D(X1+X)=D(n+1nX1+1ni=2nXi)

因为 X1,,Xn 相互独立,则:

=(n+1)2n2σ2+1n2×(n1)σ2=n2+3nn2σ2=n+3nσ2

D 同理也是不对的。

总结一下我们都用到了方差和协方差的哪些性质:

  • X,Y 相互独立,推出 D(X±Y)=D(X)+D(Y).

  • D(CX)=C2D(X).

  • cov(X±Y,Z)=cov(X,Z)±cov(Y,Z).

  • cov(X,X)=D(X).