参数估计
一、点估计
用样本的估计量直接作为总体参数的估计值
2. 缺点:没有给出估计值接近总体参数程度的信息,它与真挚的误差、估计可靠性怎么样无法知道。区间估计可以弥补这种不足。
点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等
二、 区间估计
在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的。
根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量。
三、置信水平
将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平
表示为 (1 - a% )
常用的置信水平值有 99%, 95%, 90%;相应的 a 为0.01,0.05,0.10
四、置信区间
ü 由样本统计量所构造的总体参数的估计区间称为置信区间;
ü 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间
ü 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值,我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个
置信区间的表述:
总体参数的真值是固定的,而用样本构造的区间则是不固定的,因此置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数
实际估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平(比如95%)下的置信区间。我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个
当抽取了一个具体的样本,用该样本所构造的区间是一个特定的常数区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值,因为它可能是包含总体均值的区间中的一个,也可能是未包含总体均值的那一个
一个特定的区间总是“包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题
置信水平只是告诉我们在多次估计得到的区间中大概有多少个区间包含了参数的真值,而不是针对所抽取的这个样本所构建的区间而言的
使用一个较大的置信水平会得到一个比较宽的置信区间,而使用一个较大的样本则会得到一个较准确(较窄)的区间。直观地说,较宽的区间会有更大的可能性包含参数
但实际应用中,过宽的区间往往没有实际意义
区间估计总是要给结论留点儿余地
影响置信区间宽度的因素:
1.总体数据的离散程度,用 s 来测度;2.样本容量;3. 置信水平 (1- a),影响 zα/2 的大小
五、 参数估计标准:
无偏性:估计量抽样分布的数学期望等于被估计的总体参数
有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效
一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数