第一節(jié) 計數資料常用指標

作者:徐榮祥 出版社:中國科學技術出版社 發(fā)行日期:2009年7月

一、 率的抽樣誤差和標準誤
關于抽樣誤差的概念已在第一章中作了介紹,在抽樣研究中,獲得的樣本率與總體率或各樣本率之間必然也存在著“率”的抽樣誤差。均數抽樣誤差產生的原因與之相同。表示率(比)抽樣誤差大小的統(tǒng)計指標叫率的標準誤。如某醫(yī)生調查了某鄉(xiāng)某種疾病的患病率為15%(即調查1 000人有150人患這種疾?。诔闃舆^程中必然會有抽樣誤差。被調查的這個鄉(xiāng)是一個整體,如果再次重復調查1 000人,其患病率不一定是15%,可能高一點,也可能低一點。這種差異是由于抽樣所造成的。率的標準誤根據公式計算:

式中αp為率的標準誤,π為總體率,n為樣本的含量。
由于π為總體率,實際工作中一般不知道它的數值,故常用樣本率p來代替,從而計算出率的標準誤的估計值(Sp),計算公式為:

式中Sp為率的標準誤估計值; p為樣本率;n為樣本的含量
示例341某醫(yī)生用一種新藥治療燒傷康復期貧血,100例病人有75例血液血紅蛋白增加至10g/L以上,求血紅蛋白增加率的標準誤。
【解題步驟】
1計算血紅蛋白增長率:75÷100=075,或750%。
2將數值代入公式342,計算血紅蛋白增加率的標準誤:

3分析:血紅蛋白增加率為750%,其標準誤為185%。由此可見,率的標準誤反映率的抽樣誤差大小,是衡量樣本率的穩(wěn)定性和可靠性的指標。率的標準誤越小,表示率的抽樣誤差越小,用以估計總體率的可靠性越大。反之,率的標準誤也越大,則由樣本估計總體率的可靠性就越小。
4意義:有了率的標準誤,可以用其來確定總體率的可信區(qū)間;還可用于樣本率與總體率及兩個樣本率之間差異的顯著性檢驗。
二、總體率的可信區(qū)間
由于樣本率與總體率之間存在誤差,所以我們只能根據樣本率來推算總體率的可能性。當總體率π不太接近0或1時,且每次抽樣的樣本觀察數n又不是太小時,樣本率的分布也屬正態(tài)分布。因此可以根據率的標準誤,仿照估計均數可信區(qū)間方法估計總體率所在的范圍,這個范圍即為總體率的可信區(qū)間。
總體率的可信區(qū)間公式為:

式中p為標準率,Sp為率的標準誤,U為常量。
總體率區(qū)間的表達參數與公式:①求95%可信區(qū)間的參數采用196; ②求99%可信區(qū)間的參數采用258。
即:總體率95%可信區(qū)間為:

總體率99%可信區(qū)間為:

示例342某醫(yī)院用新療法治療大面積燒傷病人243例,治愈236例,死亡7例,病死率為288%。求其總體病死率95%和99%的可信區(qū)間。
【解題步驟】
1根據例中提供的資料已知:病死率P=288%,(1-P)=9712%,n=243。
2將以上數據代入公式(342),求病死率的標準誤:

3根據公式(344)、(345),求出95%、99%的可信區(qū)間:
(1)總體率95%的可信區(qū)間范圍為:P±196SP,即288%±196×(107)=288%±210%。說明總體病死率有95%的可能性在078%~498%之間。
(2)總體率99%的可信區(qū)間范圍為:P±258SP,即288%±258×(107)=288%±276%。說明總體病死率有99%的可能性在012%~564%。
4分析:由于抽樣誤差的存在,當發(fā)現(xiàn)兩個率或兩個以上的率之間存在差異時,應考慮到差異是真正存在的,還是由于抽樣誤差造成的,故應進行顯著性檢驗。