第五節(jié) 顯著性檢驗(yàn)與顯著性水準(zhǔn)

作者:徐榮祥 出版社:中國(guó)科學(xué)技術(shù)出版社 發(fā)行日期:2009年7月
一、顯著性檢驗(yàn)(significance test)
顯著性檢驗(yàn)又稱(chēng)假設(shè)檢驗(yàn)(hypothesis testing)。假設(shè)檢驗(yàn)是統(tǒng)計(jì)學(xué)推斷的另一個(gè)領(lǐng)域,其應(yīng)用非常廣泛。醫(yī)學(xué)研究中經(jīng)常比較兩組或各組數(shù)據(jù)均數(shù)(或百分率)的差別在統(tǒng)計(jì)學(xué)上是否有顯著意義。這種檢驗(yàn)方法稱(chēng)“顯著性檢驗(yàn)”。由于客觀上存在著生物學(xué)差異及抽樣差異,所以在比較兩組均數(shù)(或百分率)時(shí)就不能只看到兩組數(shù)值上的差別,而要分析這種差別是否基本上超過(guò)了生物差異及抽樣差異的范圍,是否反映兩組(或多組)總體均數(shù)存在著差別。檢驗(yàn)的目的是計(jì)算由于偶然因素的機(jī)遇影響,出現(xiàn)這種差別的可能性有多大。
假設(shè)有兩種:一種是檢驗(yàn)假設(shè)(也稱(chēng)無(wú)效假設(shè)),符號(hào)為H0;一種是備選假設(shè),符號(hào)為H1。H1和H0是相聯(lián)系的、對(duì)立的假設(shè)。例如,為了檢驗(yàn)兩個(gè)總體均數(shù)是否相等,通常認(rèn)為,H0為兩個(gè)總體均數(shù)相等(μ1= μ2),即兩組處理效果無(wú)差別;H1為兩個(gè)總體均數(shù)不相等(μ1≠μ2),即兩組處理效果有差別。
按照統(tǒng)計(jì)學(xué)的步驟,應(yīng)先做出“無(wú)效假設(shè)”,即假設(shè)兩組資料實(shí)際上來(lái)自同一總體,目前的差別只不過(guò)是抽樣誤差所引起的。然后根據(jù)兩組樣本的實(shí)測(cè)數(shù)據(jù)和例數(shù)(樣本數(shù)),計(jì)算出上述“無(wú)效假設(shè)”的可能性有多大?如果這種可能性小于5%(或l%),就可以認(rèn)為兩組數(shù)據(jù)來(lái)自同一總體的可能性很小,可以否定“無(wú)效假設(shè)”,而承認(rèn)兩組均數(shù)的差異在統(tǒng)計(jì)學(xué)上有顯著(或非常顯著)統(tǒng)計(jì)學(xué)意義。統(tǒng)計(jì)學(xué)上認(rèn)為,由抽樣誤差引起的差異是非本質(zhì)性的,是沒(méi)有意義的;由于實(shí)驗(yàn)因素引起的差異才是本質(zhì)性的,才是有意義的。統(tǒng)計(jì)學(xué)把前者稱(chēng)為“不顯著”,把后者稱(chēng)“顯著”。
現(xiàn)舉例說(shuō)明,無(wú)效假設(shè)就是實(shí)驗(yàn)前先假設(shè)給予的條件(如藥物、治療方法等)不起作用,即實(shí)驗(yàn)組給甲藥治療與對(duì)照組給乙藥治療的療效一樣,樣本來(lái)自同一個(gè)總體。最后將實(shí)驗(yàn)結(jié)果進(jìn)行統(tǒng)計(jì)學(xué)處理,如兩組實(shí)驗(yàn)結(jié)果無(wú)差別,即接受無(wú)效假設(shè),兩組的差異是抽樣造成的;如兩組實(shí)驗(yàn)結(jié)果有差別,即拒絕無(wú)效假設(shè),接受備選假設(shè),認(rèn)為兩組數(shù)值之差代表著幾個(gè)規(guī)律不相同的總體(一個(gè)為給予條件的總體,一個(gè)為對(duì)照的總體)。這就是統(tǒng)計(jì)學(xué)處理的依據(jù)。
二、顯著性水準(zhǔn)
根據(jù)醫(yī)學(xué)統(tǒng)計(jì)學(xué)的統(tǒng)傳規(guī)定:P=001及P=005為“顯著性水準(zhǔn)”,并作為判斷顯著意義的標(biāo)準(zhǔn)。P值也可通俗地理解為“批(P)駁兩組差別有統(tǒng)計(jì)意義的可能性”。
P≤001,批(P)駁的可能性小于或等于1%,即承認(rèn)兩組間差別有統(tǒng)計(jì)意義的可能性大于或等于99%。此時(shí)可作統(tǒng)計(jì)結(jié)論認(rèn)為:“兩組間差別有非常顯著的意義”。
P≤005(即001<P≤005),批(P)駁的可能性小于或等于5%,說(shuō)明有95%以上的概率可認(rèn)為兩組不是來(lái)自同一總體,結(jié)論為:兩組間差別有顯著意義。
P>005,批(p)駁的可能性大于5%,說(shuō)明兩組均數(shù)盡管不同,但該差別來(lái)自抽樣誤差的概率大于5%,結(jié)論為:兩組間差異無(wú)顯著意義。
兩組間差異不顯著說(shuō)明兩數(shù)值之差可能都是由抽樣誤差引起的;差異顯著說(shuō)明兩數(shù)值之差可由抽樣引起的可能性等于或小于5%,兩組之差很可能代表了兩個(gè)規(guī)律不同的總體;差異非常顯著說(shuō)明兩數(shù)值來(lái)自一個(gè)總體的可能性等于或小于1%,更有可能來(lái)自同一總體。
三、統(tǒng)計(jì)結(jié)論與專(zhuān)業(yè)結(jié)論
“有顯著意義”是個(gè)統(tǒng)計(jì)結(jié)論,表示統(tǒng)計(jì)推斷(否定無(wú)效假設(shè))的可靠程度,說(shuō)明兩組總體很可能不同,但不能說(shuō)明差別的大小,更不能說(shuō)明差別之間有任何因果關(guān)系。“無(wú)顯著意義”是說(shuō)明根據(jù)現(xiàn)有數(shù)據(jù)尚不足于否定無(wú)效假設(shè),并不是說(shuō)沒(méi)有差異,更不能說(shuō)兩組基本相同。
在作專(zhuān)業(yè)結(jié)論時(shí)除了考慮統(tǒng)計(jì)結(jié)論外,還要結(jié)合專(zhuān)業(yè)知識(shí)全面考慮,不能做出脫離實(shí)際或脫離本題的結(jié)論。例如,兩組尿量每日只差100mL,或血壓只差0667kPa(5mmHg),這時(shí)即使統(tǒng)計(jì)結(jié)果差別有顯著意義。實(shí)際上,這點(diǎn)細(xì)微差別并非有臨床價(jià)值,不應(yīng)做出有利尿作用或降壓作用的專(zhuān)業(yè)結(jié)論。再如,甲組創(chuàng)面的愈合時(shí)間為125±27天,乙組創(chuàng)面的愈合時(shí)間為132±30天,看起來(lái)甲組的愈合時(shí)間似乎比乙組提前了接近一天,即使有顯著意義但無(wú)臨床意義,因?yàn)閯?chuàng)面的愈合是以晝夜整天為單位計(jì)算的。