假设检验
一、概念
先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程
有参数检验和非参数检验
逻辑上运用反证法,统计上依据小概率原理
什么小概率?
1. 在一次试验中,一个几乎不可能发生的事件发生的概率
2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设
3. 小概率由研究者事先确定
怎样通过假设检验去掉偶然性
利用P值进行检验就可以去掉偶然性。因为P值告诉我们在某个总体的许多样本中,某一类数据出现的经常程度,P值是当原假设正确的情况下,得到所观测的数据的概率。如果原假设是正确的,P值若很小,则告诉我饿们得到这样的观测数据是多么的不可能,相当不可能得到的数据,就是原假设不对的合理证据,偶然性也就消除了。
二、原假设
1. 研究者想收集证据予以反对的假设。是关于总体参数的表述,它是接受检验的假设。
2. 总是有符号 =, £ 或 ³
3. 表示为 H0
n H0 : m = 某一数值
n 指定为符号 =,£ 或 ³
三、备择假设
研究者想收集证据予以支持的假设。党员假设被否定时另一种可成立的假设。
总是有符号 ¹, < 或 >
表示为 H1
n H1 : m <某一数值,或m >某一数值
四、结论与总结
原假设和备择假设是一个完备事件组,而且相互对立
n 在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立
先确定备择假设,再确定原假设
等号“=”总是放在原假设上
因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)
五、两类错误
1. 第Ⅰ类错误(弃真错误)
原假设为真时拒绝原假设
第Ⅰ类错误的概率记为a。被称为显著性水平。常用的 a 值有0.01, 0.05, 0.10
2. 第Ⅱ类错误(取伪错误)
原假设为假时未拒绝原假设
第Ⅱ类错误的概率记为b (Beta)
影响b错误的因素:1. 总体参数的真值。随着假设的总体参数的减少而增大
2. 显著性水平 a。当 a 减少时增大 3. 总体标准差 s。当 s 增大时增大 4.样本容量 n。当 n 减少时增大
控制:进行假设检验时总希望犯两类错误的可能性都很小,然而,在其他条件不变的情况下,a与b是此消彼长的关系,二者不可能同时减小。若要同时减小a与b,只能是增大样本量。一般总是控制a,是犯错误的概率不大于a,即a是允许犯弃真错误的最大概率值(而P值相当于根据样本计算的犯弃真错误的概率值,故P值又称为观测的显著性水平)。但确定a时必须注意,如果犯弃真错误的代价较大,a可取小些,相反,如果返取伪错误的代价较大,则a宜取大些(以使b较小)
六、假设检验的结论表述
假设检验的目的就在于试图找到拒绝原假设,而不在于证明什么是正确的
拒绝原假设时结论是清楚的
例如,H0:m=10,拒绝H0时,我们可以说¹m10
当不拒绝原假设时
并未给出明确的结论
不能说原假设是正确的,也不能说它不是正确的
例如, 当不拒绝H0:m=10,我们并未说它就是10,但也未说它不是10。我们只能说样本提供的证据还不足以推翻原假设
七、统计上的显著与实际意义
1. 当拒绝原假设时,我们称样本结果是统计上显著的(statistically Significant)
2. 当不拒绝原假设时,我们称样本结果是统计上不显著的
3. 在“显著”和“不显著”之间没有清除的界限,只是在P值越来越小时,我们就有越来越强的证据,检验的结果也就越来越显著
4. “显著的”(Significant)一词的意义在这里并不是“重要的”,而是指“非偶然的”
5. 一项检验在统计上是“显著的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的
6. 如果得到这样的样本概率(P)很小,则拒绝原假设
在这么小的概率下竟然得到了这样的一个样本,表明这样的样本经常出现,所以,样本结果是显著的
7. 在进行决策时,我们只能说P值越小,拒绝原假设的证据就越强,检验的结果也就越显著
8. 但P值很小而拒绝原假设时,并不一定意味着检验的结果就有实际意义
因为假设检验中所说的“显著”仅仅是“统计意义上的显著”
一个在统计上显著的结论在实际中却不见得就很重要,也不意味着就有实际意义
9. 因为值与样本的大小密切相关,样本量越大,检验统计量的P值也就越大,P值就越小,就越有可能拒绝原假设
10.如果你主观上要想拒绝原假设那就一定能拒绝它
这类似于我们通常所说的“欲加之罪,何患无词”
只要你无限制扩大样本量,几乎总能拒绝原假设
11.当样本量很大时,解释假设检验的结果需要小心
在大样本情况下,总能把与假设值的任何细微差别都能查出来,即使这种差别几乎没有任何实际意义
12.在实际检验中,不要刻意追求“统计上的”显著性,也不要把统计上的显著性与实际意义上的显著性混同起来
n一个在统计上显著的结论在实际中却不见得很重要,也不意为着就有实际意义