理论教育 假设检验错误与显著性水平-统计学

假设检验错误与显著性水平-统计学

时间:2023-07-29 理论教育 版权反馈
【摘要】:表7-2假设检验决策结果因此,根据样本做出判断时,有可能会犯两种类型的错误。在假设检验理论中,α 又被称为显著性水平。假设检验中犯第一类错误的概率被称为显著性水平,记为α。如果样本提供的证据拒绝原假设,则表明检验结果是显著的;如果不拒绝原假设,则表明检验结果是不显著的。

假设检验错误与显著性水平-统计学

(一)假设检验中的两类错误

在假设检验中,人们对于总体提出的问题的真实性往往是未知的,因此我们通过从样本获得的信息,用假设检验的方法来对原假设的真实性做出拒绝或接受的判断。这种判断有时会产生关于总体的错误结论,并且要承担一定的风险。

由于样本具有随机性,我们利用样本对两个对立假设进行判断,有可能出现两种情况:否定H0,接受H1;不否定H0,即H1被否定。但一个被否定了的假设可能是真实的,也可能是不真实的。因此我们在检验时所做出的判断将会出现四种可能:否定了不真实的原假设;否定了真实的原假设;接受了不真实的原假设;接受了真实的原假设。以上四种可能可以归纳为表7-2 所示的内容。

表7-2 假设检验决策结果

因此,根据样本做出判断时,有可能会犯两种类型的错误。

第一类错误也称为弃真错误。弃真错误是在拒绝原假设时出现的错误,指的是原假设H0本来正确,但按照检验规则却做出了拒绝原假设H0的判断,即否定了未知的真实情况,把真的当成了假的。其发生的概率称为犯第一类错误的概率,也称为弃真错误的概率,记为α。在假设检验理论中,α 又被称为显著性水平。(www.daowen.com)

第二类错误也称取伪错误。取伪错误是在接受原假设时出现的错误,指的是原假设H0本来不正确,但按照检验规则却做出了接受原假设H0的判断,即接受了未知的不真实状态,把假的当作真的接受了。其发生的概率称为犯第二类错误的概率,也称取伪错误的概率,记为β。对于检验者来说,当然希望β 值尽可能小。换言之,就是希望1-β 值尽可能大,即希望H0不真实而被舍弃的概率越大越好。1-β 越接近1,表示不真实的原假设H0几乎都能够被拒绝;相反,1-β 越接近于0,犯第二类错误的可能性就越大。因此,1-β 的大小是衡量检验工作做得好坏的一个指标,在统计上称为检验功效。

在进行检验决策时,我们当然希望所有真实的原假设都能够被接受,所有不真实的原假设都能被拒绝,做到既降低犯第一类错误的可能性,又减少犯第二类错误的概率水平。但事实上,第一类错误和第二类错误是一对矛盾体。在其他条件不变的情况下,减少犯第一类错误的可能性,势必增加犯第二类错误的可能性。例如,某工厂准备购买一批较便宜的原料,厂家决定,要是这批原材料的次品率达到5%以上,就拒绝购买。逐批检验,当检验结果是拒绝购买时,就有可能犯第一类错误,即工厂可能拒购一批便宜的合格材料,而另高价购买原材料,这样便会增加产品成本;相反,如果厂方接受这批原材料,就有可能犯第二类错误,即工厂可能购进一批不合格的原材料,产品的次品率就要上升。显然,工厂决策者有必要搞清哪类错误造成的损失较小,可能减少成本。

要想同时减少犯两类错误的可能性,只能采用增加样本容量的办法来解决。但在实际工作中,不可能无限增大样本容量,否则就会使抽样调查失去意义。因此,决策者往往通过权衡犯两种错误所可能花费的代价来决定显著性水平。一般说来,哪一类错误所带来的后果越严重,危害越大,在假设检验中就应把哪一类错误作为首要的控制目标。但在假设检验中,大家都在执行这样一个统一的原则,即首先控制错误原则。这样做的一个原因是大家都遵循一个统一的原则,讨论问题就比较方便;另一个原因在于,从实用的观点看,原假设是什么常常是明确的,而备择假设是什么常常是模糊的。

(二)显著性水平

发生第一类错误的概率也常被用于检验结论的可靠程度。假设检验中犯第一类错误的概率被称为显著性水平,记为α。显著性的意义在这里并不是“重要的”,而是指“非偶然的”。如果样本提供的证据拒绝原假设,则表明检验结果是显著的;如果不拒绝原假设,则表明检验结果是不显著的。一项检验在统计上是“显著的(拒绝原假设)”,意思是这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的。同样,如果检验结果是不显著的(没有充分的证据拒绝原假设),则表明这样的(样本)结果是偶然得到的。

在假设检验过程中,我们可以依据显著性水平的大小把概率分布划分为两个区间:小于给定标准的概率区间称为拒绝域,大于这个标准的概率区间则称为接受域。假如给定的小概率标准为α=0.1,即凡概率小于10%的事件都称为小概率事件,都属于拒绝域。若事件属于接受域,则原假设成立而无显著差异;若事件属于拒绝域,则拒绝原假设且认为有显著差异。显著性水平α 所对应的概率度称为α 的临界值,是原假设拒绝域和接受域的分界线。仅以单侧检验中的右侧检验为例,我们称概率小于α 的事件为小概率事件,等同于大于临界值的事件就是小概率事件,可以直接利用概率表查找临界值作为判断的依据。

另外,显著性水平并不是一个固定不变的数字,它的大小随着研究问题的性质及对结论准确性的要求不同而变动,主要依据拒绝域所可能承担的风险来决定。著名英国统计学家Ronald Fisher 在他的研究中把小概率的标准定为0.05,所以作为一个普遍适用的原则,人们通常选择显著性水平为0.05 或比0.05 更小的概率。常用的显著性水平有α=0.01、α=0.05、α=0.1 等,当然也可以取其他值。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈