点估计
频率替代法
若从服从 的总体中抽样 28 次,有 21 次小于 4:
矩估计法
其理论基础是 Khinchine 大数定律。一般只用到最高 阶矩
矩估计法的核心 是使用样本的 阶矩作为总体的 阶矩的估计量。
设总体 的分布函数为 ,其中待估计的参数为 ,并假设 阶原点矩存在,记为:
根据大数定律,写出:
如果方程组有解:
这些方程称为 矩估计量,将 以具体的样本值代入,称为矩估计值。
例如:
矩估计量矩估计量
设 ,给出 的矩估计量。
注意到 ,因此不能用一阶矩估计。
使用二阶矩:设 .
因此, 的矩估计量为:
设总体 服从 ,给出 的矩估计量。
最大似然估计法
一般地,设 为离散型随机变量/连续型随机变量,其分布律/概率密度为:
则 的概率分布为:
当 确定时,即为 . 写出方程组:
设总体 , 是样本值,求 的最大似然估计。
当都 因此,结论和矩估计法一样。
设总体 , 是样本值,求 的最大似然估计。
则:
似然函数是严格单调的时候,该怎么处理?极大值/极小值在边界取到。
设 ,求最大似然估计值和最大似然估计量。
当 则需要满足 都在 的区间内,使得 最小:
综合问题:设总体 的概率密度为:
求 的矩估计量和最大似然估计量。
因此 矩.
(当) 因此是单调的,需要 尽量小,但是不能小于 ,因此
最大似然估计不变性原理 设 是未知参数 的最大似然估计,又设 是 的连续函数,则 是 的最大似然估计。
如果:
,则可以算出 的最大似然估计为:
设 ,求 的最大似然估计。
如何理解这件事,就是抽取样本 ,要你给出 的最大似然估计。
利用:
显然是关于 的连续函数,则 的最大似然估计为:
估计量的评价指标
Q: 我们使用不同的方法(如矩估计法和最大似然估计法)可能得到不同 ,如何确定这些 的好坏?
和真实的 尽量接近?
无偏性
定义,若有:
则称 是 的 无偏估计量,反之如果 ,则称 为估计量 的 偏差。
无偏性是对于一个估计量最基本的要求。
说明 是 的无偏估计量。
因此,矩估计是无偏的。当 ,我们有:样本均值是总体期望的无偏估计量。当 ,我们有:样本的二阶原点矩是总体二阶原点矩的无偏估计量。
判断无偏性:
. 是总体期望的无偏估计量。
样本二阶中心距 不是总体方差的无偏估计量。
样本方差 是总体方差的无偏估计量。
因为:
当 , 是总体期望的无偏估计量。
设总体 ,求常数 ,使得 为 的无偏估计量。
先计算:
现在知道 ,求 的数学期望?
应该 因此,
设 是总体 的样本,且已知,求 的无偏估计量。
利用 .
总体期望的无偏估计量总体方差的无偏估计量 再进行验证:
Q:
显然不等,因此 不是 的无偏估计量。其原因是期望只具有线性性。
Q: 能不能用 的表达式进行估计?
因此有:
——用不同的方法,也可以得出不同的估计量,它们都是无偏的。
当 是 的无偏估计量, 是否为 的无偏估计量?
有效性
设 和 均为 的 无偏估计量(也就是两种不同的估计方法),对于任意 有
则称 比 有效。
估计量在无偏的情况下,才能评价有效性。
设总体 为未知参数, 是总体 的样本。证明 与 都是 的无偏估计量。注意到:
因此都是无偏估计量。
然后比较方差:
因此 更有效。
设总体 的概率密度为:
我们已经知道 矩. 先求得分布函数:
因此, 不是无偏估计量,需要乘以 修正。
对于 满足 Poisson 分布,判断哪一个最有效:
注意到 不是无偏估计量。因此只用比较 .
因此 , 更有效。注意到
都是无偏估计量,则使得 尽量小,则估计量更有效。
一方面,当 恒定,
根据 Cauchy 不等式,有:
因此,
等号当 时,即样本均值时取到。
另一方面,如果想要更有效,我们还可以增加 .
这告诉我们样本均值在所有的样本加权和中,是最有效的无偏估计量。
这样产生一个问题, 能不能任意小,是否存在下界?
我们有 Rao-Cramer 不等式来说明这个问题
其中 是实数轴上开区间。
并且设 为来自总体 的一个样本,如果:
则 有以下结果:
称 为方差的下界,如果能够找到一个估计量 ,使得 ,则称 是 的有效估计量。
设总体 ,判断 是否为 的有效估计量。
我们有:
因此 ,而且 ,因此为有效估计量。
一致性
考虑 , 在无穷远处的性态。
一致性的定义 序列 依概率收敛于 ,即 ,有:
则称 为 的一致估计量。
等价条件:.
证明,使用 Chebyshev 不等式。
利用样本 阶矩是总体 阶矩的一致估计量的性质,可以说明:
是 的一致估计量;
是 的一致估计量:
一概率收敛于:
区间估计
能否给出一个参数区间 ,使得有 95% 的概率包含真实的 ?
用正态分布举例:
则称区间 为参数 的置信度为 的置信区间。
——仅仅和 有关。
双侧置信区间
如果 是待估计参数, 是来自总体 的一个样本,如果对于给定的 ,存在 和 ,使得:
则称区间 是 的置信度为 的置信区间。 称为置信度。
问题,两端分位数选取 ,是否有其它取法?可不可以取 ?
可以分析,两种取法区间长度分别为:
不对称的区间长度更长。
置信区间的取法不唯一,需要保证置信度的前提下,最小化置信区间长度,也就是最小化平均长度 .
一般来说,置信度越高,置信区间的长度越长——可靠度和估计的精度是矛盾的,在满足可靠度的前提下,可以增大样本容量,来增加估计的精度。
构造一个样本的函数:
称为枢轴量,含有待估参数,不含有其它未知参数,其分布已知,且分布不依赖待估计参数(我们通常选用标准的三大统计分布,一定不能含有其它未知参数,否则连分位数都不好求……)。
枢轴量一定要会写哦,对于正态总体 .
为了强调枢轴量只含有待估计参数,不含有其它未知参数,将待估计参数标红。
给定置信度 ,确定两个常数 使得:
由 ,解出 .
正态总体 中均值 的置信区间
如果方差已知,则:
可以得到置信区间为 ;
如果方差 未知,可以用样本方差 替代,枢轴量为:
可得置信区间为:
正态总体 中方差 的置信区间
当 已知,取枢轴量:
则有:
置信区间为:
当 未知,取枢轴量:
得到方差 置信度为 的置信区间为:
判断正确置信区间:
判断选择了什么枢轴量,枢轴量服从什么分布。
满足概率要求,置信度为 .
单侧置信区间
对于给定的 , 是待估计参数, 是样本,给出统计量 ,满足:
则称区间 是置信度为 的单侧置信区间, 是单侧置信上界。
给出统计量 ,满足:
则称区间 是置信度为 的单侧置信区间, 是单侧置信下界。
注意是直接和 进行比较,而不是和枢轴量进行比较。
方差已知,求均值
枢轴量为:
方差未知,求均值
枢轴量为:
则:
单侧置信下界为:
均值未知,求方差
枢轴量为:
要使得:
则有:
单侧置信上界为:
注意还可以使用公式 .
两个正态分布总体的区间估计
对于两个正态总体 ,估计 和 .
假设样本 和 分别来自两个正态总体,并且它们相互独立,则:
因此,当 已知,包含 的枢轴量可以取:
当 未知,但 ,枢轴量可以取:
其中, 为加权平均,等于 .
当 未知,但是 ,可以进行配对,,利用单个正态总体区间估计,有:
其中 .
当 未知,但是 很大,可以使用中心极限定理:
近似分布为 在单个正态总体区间估计中,我们用过用样本方差代替总体方差的做法,最后枢轴量服从 t 分布,而 t 分布当 很大时又近似为正态分布。因此做一个不怎么严谨的类推,推广到两个正态分布,就可以理解为什么这里近似服从正态分布。
当 未知,求方差比 的置信区间 构造枢轴量: