

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、在公共衛(wèi)生領(lǐng)域的抽樣調(diào)查中為了減少抽樣誤差,提高抽樣的精度,經(jīng)常會采用如分層整群抽樣這類復(fù)雜的抽樣方法。由于這類抽樣方法所得到數(shù)據(jù)往往是具有多層次的結(jié)構(gòu)特點的,這就使得在同一較低層次的各個個體之間具有一定的相關(guān)性,即結(jié)局變量的分布在個體間不具備獨立性。因而不滿足傳統(tǒng)的統(tǒng)計分析方法的應(yīng)用條件,而多層統(tǒng)計分析模型和復(fù)雜抽樣的統(tǒng)計分析方法均可以處理這類數(shù)據(jù)。
目的:
研究和分析廣義線性混合效應(yīng)模型和復(fù)雜抽樣的logisti
2、c回歸方法在分層整群抽樣數(shù)據(jù)中的應(yīng)用,通過實例數(shù)據(jù)分析以及數(shù)據(jù)模擬的研究方法,結(jié)合國際通用統(tǒng)計分析軟件SAS中相應(yīng)的模塊GLIMMIX與SURVEY模塊來進行這兩種方法在分層整群抽樣數(shù)據(jù)中的比較應(yīng)用。并通過改變模擬數(shù)據(jù)的參數(shù)組合,來比較在不同的內(nèi)部相關(guān)系數(shù)(ICC),給定個體水平變量系數(shù),抽樣比以及樣本量的情況下二者的適用性。同時,為了驗證傳統(tǒng)的統(tǒng)計分析方法在分層整群抽樣數(shù)據(jù)分析中的局限性,也將傳統(tǒng)的logistic回歸模型納入到比較分
3、析中。
方法:
首先將三種統(tǒng)計方法應(yīng)用到實例數(shù)據(jù)的分析中,參考其分析結(jié)果設(shè)定模擬數(shù)據(jù)的參數(shù)值。數(shù)據(jù)模擬分兩個部分:模擬一研究,模擬還原實例數(shù)據(jù)的總體,并從中進行分層整群抽樣,模擬抽樣1000次,對每一次抽樣的數(shù)據(jù)分別應(yīng)用logistic回歸模型,復(fù)雜抽樣的logistic回歸模型以及廣義線性混合效應(yīng)模型三種方法進行分析;模擬二研究,在模擬一研究的基礎(chǔ)上,改變模擬的參數(shù):各層的內(nèi)部相關(guān)系數(shù)ICC,給定個體水平變量系數(shù)以
4、及不同的抽樣比來比較這三種方法的適用性,模擬次數(shù)1000次。兩個階段的模擬評價指標(biāo)為:第Ⅰ類錯誤率,偏倚,95%可信區(qū)間覆蓋率,功效以及標(biāo)準(zhǔn)誤。
結(jié)果:
實例數(shù)據(jù)的分析中,在應(yīng)用surveylogistic回歸(surveylogistic)與廣義線性混合效應(yīng)模型(GLMM)進行調(diào)整后,各回歸系數(shù)的標(biāo)準(zhǔn)誤都比logistic回歸中的標(biāo)準(zhǔn)誤大,且各危險因素的OR值的95%可信區(qū)間較logistic回歸都有不同程度的增寬
5、。
數(shù)據(jù)模擬分析中,surveylogistic和GLMM對分析結(jié)果的影響,主要體現(xiàn)在組群水平(即宏觀層次)的變量上。從模擬評價指標(biāo)來看:在第Ⅰ類錯誤的控制上,GLMM表現(xiàn)最強,surveylogistic在組群水平變量上表現(xiàn)的與GLMM一致,但是在個體水平變量上,卻是三種方法上最差的。當(dāng)人數(shù)多的一層的ICC為0.1,人數(shù)少的一層的ICC為0.5,抽樣比是按相同抽樣概率抽樣時,應(yīng)用surveylogistic回歸模型對個體水平
6、變量第1類錯誤率影響最大。隨著人數(shù)多的一層的ICC增大,組群水平變量的第1類錯誤率會增高。
95%可信區(qū)間覆蓋率最高的是GLMM,無論在個體水平還是組群水平變量上,最差的是logistic回歸,同時,95%可信區(qū)間覆蓋率還受抽樣比和給定個體水平變量的系數(shù)的影響,且人數(shù)多的一層的ICC和方法形成交互作用影響95%可信區(qū)間覆蓋率。三種統(tǒng)計方法對個體水平和組群水平變量的偏倚的影響差異不大,相比之下,GLMM比其他兩種方法對偏倚的影響
7、要大。
結(jié)論:
傳統(tǒng)的logistic回歸方法在分層整群抽樣數(shù)據(jù)中應(yīng)用是受到限制的。在做這類數(shù)據(jù)分析時,我們可以從兩個角度去考慮分析:在個體水平變量上,最好的方法是GLMM,而如果應(yīng)用傳統(tǒng)的logistic回歸方法在兩層ICC都不大的情況下,也不會出現(xiàn)大的問題,不建議使用復(fù)雜抽樣的logistic回歸;但是,在組群水平變量的問題上時,傳統(tǒng)的logistic回歸方法會造成參數(shù)估計的標(biāo)準(zhǔn)誤被低估,從而使得其顯著性檢驗過于
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 復(fù)雜隨機抽樣數(shù)據(jù)的多重線性與多重logistic回歸分析方法及其應(yīng)用.pdf
- 復(fù)雜抽樣下的截取回歸模型在醫(yī)學(xué)研究中的應(yīng)用.pdf
- Lasso在廣義線性模型中的應(yīng)用——基于Logistic回歸方法的財務(wù)預(yù)警模型.pdf
- 廣義線性混合模型在精算分析中的應(yīng)用.pdf
- 抽樣論文-對比分析簡單隨機抽樣和整群抽樣
- 花費模型下的廣義排續(xù)集抽樣.pdf
- 基于廣義線性模型、廣義線性混合模型、偏最小二乘-logistic回歸對我國當(dāng)前收入分配滿意度情況的.pdf
- 地學(xué)抽樣模型及抽樣方案的設(shè)計與應(yīng)用.pdf
- BP網(wǎng)絡(luò)與Logistic回歸模型在模式分類中的比較研究.pdf
- 死因監(jiān)測整群抽樣設(shè)計方案的比較研究.pdf
- 聚類抽樣情形下基于廣義線性模型的風(fēng)險比估計.pdf
- 分類敏感問題RRT模型下分層二階段整群抽樣的統(tǒng)計方法及應(yīng)用.pdf
- 基于輔助信息在分層抽樣中敏感性問題的模型分析.pdf
- 二階段整群抽樣病例對照數(shù)據(jù)的分析.pdf
- Logistic回歸模型中模型選擇的漸近概率.pdf
- 變結(jié)構(gòu)協(xié)整模型及其在經(jīng)濟數(shù)據(jù)分析中的應(yīng)用.pdf
- 多水平計數(shù)模型在復(fù)雜抽樣調(diào)查中的應(yīng)用研究.pdf
- logistic回歸模型
- 線性與廣義線性模型逆回歸的統(tǒng)計分析.pdf
- 多元線性回歸模型中缺失數(shù)據(jù)填補方法的效果比較.pdf
評論
0/150
提交評論