Lataa esitys
Esittely latautuu. Ole hyvä ja odota
JulkaistuAimo Melasniemi Muutettu yli 9 vuotta sitten
1
Terveys tutkimus Otanta-asetelman ja painotuksen huomioon ottaminen analyysissä Yleinen lähdeviite: Laiho, J. & Nieminen, T. (toim.) Terveys tutkimus. Aikuisväestön haastatteluaineiston tilastollinen laatu. Tilastokeskus, Tutkimuksia 239. Kari Djerf
2
Sisältö 1. Tutkimusasetelma 2. Otanta-asetelma 3. Vastauskato
4. Aineiston painotus 5. Otanta-asetelman ja painotuksen vaikutuksesta tilastollisiin analyyseihin Kari Djerf
3
1. Terveys 2000 -tutkimuksen asetelma
T2000 -tutkimus lienee laajin Suomessa toteutettu haastattelu- ja kyselytutkimus Tutkimuskokonaisuus sisältää: T2000 päätutkimuksen (30+ -vuotta täyttänyt väestö) T2000 nuoria aikuisia koskeneen osan (18-29 v.) Mini-Suomi -tutkimuksen seurantatutkimuksen Kari Djerf
4
T2000 päätutkimus eli 30+ -v. väestö
Kotihaastattelu (keskimäärin 95 min, Tilastokeskuksen haastattelijaorganisaatio) kutsu terveystarkastukseen Terveystarkastus terveyskeskuksessa (keskimäärin 3 h 15 min, KTL:n kiertävä tutkimusorganisaatio) useita osioita Osa jatkotutkimuksiin yliopistosairaalaan Kari Djerf
5
Tutkimuksen vaiheet kaaviona
Kari Djerf
6
sisäänrakennettuja tutkimusasetelmia, kuten rinnakkaismittauksia
Eri osioissa: sisäänrakennettuja tutkimusasetelmia, kuten rinnakkaismittauksia koe-verrokki -asetelmia Kari Djerf
7
2. T2000-tutkimuksen otanta-asetelma
2.1. Tutkimusasetelman rajoitteet Otanta-asetelmaa laadittaessa jouduttiin ottamaan huomioon useita reunaehtoja: terveystarkastuspaikkoja kyettiin järjestämään vain terveyskeskuksiin kiertävää henkilökuntaa ei ollut mahdollista palkata kovin paljon maan eri osat ja eri väestöryhmät piti saada riittävän ”edustaviksi” otoksessa Kari Djerf
8
Ahvenanmaa ja saaristo suljettiin pois kulkuyhteyksien takia
2.2. Tekniset rajoitteet Maa jaetaan hallinnollisesti yliopistosairaalapiirien eli ns. miljoonapiirien mukaan Paikallisena yksikkönä on terveyskeskus (joko kuntayhtymä tai kunnan oma) Ahvenanmaa ja saaristo suljettiin pois kulkuyhteyksien takia Kari Djerf
9
2.3. Otanta-asetelmasta saavutettu kompromissi
Jaetaan perusjoukko eli manner-Suomi viiteen osaan miljoonapiirien mukaan (alueellinen pää-OSITUS) Poimitaan kustakin miljoonapiiristä yhteensä 16 alueellista terveyskeskusta ja niissä kussakin varsinainen otos (pää-RYVÄSTYS) Käsitellään 15 suurinta kaupunkia erikseen niin, että ne sisältyvät otokseen a priori ja niiden otos poimitaan suoraan väestöosuuden suhteessa Kari Djerf
10
80 v. täyttäneen väestön osuus tuplattiin otokseen
Poimitaan muut terveyskeskukset suhteessa niiden väkimäärään (PPS-otanta) siten, että miljoonapiirissä rypäiden yhteismäärä on 16 Poimitaan valittujen toisen asteen terveyskeskusten sisältä otos niin, että otosalkioiden luku on kiinteä ositteen sisällä 80 v. täyttäneen väestön osuus tuplattiin otokseen Kari Djerf
11
Lopputulos Likimäärin ITSEPAINOTTUVA OTOS v. väestön osalta, 80 v. vanhuksia tuplaten Kompleksi otanta-asetelma - yhdistelmä ositetusta yksi- ja kaksiasteisesta otannasta. Koko maassa 5*16=80 poimintavaiheen ryvästä Kari Djerf
12
2.3. Otoksen maantieteellinen jakauma
Kari Djerf
13
2.4. Otoksen jakautuminen alueittain, n = 8028
HYKS (HUS) Helsinki Espoo Vantaa jne. 2. asteen rypäät 100 TYKS Turku Pori 2. asteen rypäät TaYS Tampere jne. 2. asteen rypäät 110 KYS Kuopio jne. 2. asteen rypäät OYS Oulu 2. asteen rypäät Kari Djerf
14
3. Vastauskato Terveystutkimuksissa vastausosuus ylipäänsä kohtuullisen hyvä, mutta se vaihtelee tutkimuksen ja sen toteutuksen mukaan T2000 pääraportissa ns. maksimaalinen vastausosuus 93 %: hyväksyttävä vastaus saatu johonkin osioon Seuraavassa aineiston muodostuminen sekä vastaamiseen ja katoon liittyviä tarkasteluja haastatteluosuudesta Kari Djerf
15
3.1. Aineiston muodostuminen tutkimuksen eri vaiheissa
Pääraportti B3/2002 Kotihaastattelu 6986 Terveystarkastus 6354 Kotiterveystark Kysely Puhelinhaastattelu 454 Jälkikysely Vähintään jokin osio 7419 Painotusvaihe marraskuu 2002 Osallistunut johonkin 7415 Unioni Ravintokysely 6005 Leikkausjoukko 5482 Kari Djerf
16
3.2. Terveyshaastatteluun vastaaminen
Kari Djerf
17
Vastaamista ja katoa koskevat tarkastelut
Ensin kuvailevat analyysit: ikä sukupuoli kieli alue sosioekonomiset olot Sitten vaativammat analyysit, kuten vastausosuuden mallitus Kari Djerf
18
Tavoite selvittää jakaumien yhtäläisyydet ja erot
arvioida onko vastaamisprosessi tutkittavan ilmiön kannalta harmiton vai ei pyrkiä kompensoimaan vastaamisprosessin vaikutuksia, jotta analyysit eivät vinoutuisi (tai tulisi harhaisiksi) Kari Djerf
19
Vastausosuus maantieteellisesti
Kari Djerf
20
Kato iän ja sukupuolen mukaan - naiset
Kari Djerf
21
Kato iän ja sukupuolen mukaan - miehet
Kari Djerf
22
Kato äidinkielen ja sukupuolen mukaan -naiset
Kari Djerf
23
Kato äidinkielen ja sukupuolen mukaan - miehet
Kari Djerf
24
Kato sosioekonomisen aseman ja sukupuolen mukaan - naiset
Kari Djerf
25
Kato sosioekonomisen aseman ja sukupuolen mukaan - miehet
Kari Djerf
26
Kato bruttotulojen ja sukupuolen suhteen - naiset
Kari Djerf
27
Kato bruttotulojen ja sukupuolen suhteen - miehet
Kari Djerf
28
Kato asuntokunnan koon ja sukupuolen suhteen - naiset
Kari Djerf
29
Kato asuntokunnan koon ja sukupuolen suhteen - miehet
Kari Djerf
30
3.3. Johtopäätökset Epäilyä vastausprosessiin sisältyvästä valikoituvuudesta ei voida sulkea pois! Vastaamiseen liittyvillä tekijöillä (ikä, sukupuoli, sosioekonominen asema jne.) saattaa olla riippuvuutta tutkimusmuuttujien kanssa. Erityisesti vanhusten ja muiden kuin suomen- ja ruotsinkielisten osuus pieneni tutkimuksen loppua kohti Aineistosta muodostetaan eri tutkimuksiin osajoukkoja, joihin mahdollisesti liittyvää valikoitumista on vaikea todentaa Kari Djerf
31
4. Painotus Terveys 2000 aineistoon estimoitiin KTL:n pyynnöstä neljät painot : Kaikki eli osallistunut johonkin (7415) lähinnä rekisteritutkimuksia varten Unioni (7112) Ravintokysely (6005) poikkeava ! Leikkaus (5482) Kari Djerf
32
4.1. Painotuksen periaatteet
Reunaehdot: ositus, ryvästys ja vanhusten ylipoiminta pakko ottaa huomioon Painotus yritettiin tehdä niin vähän harmia aiheuttavaksi kuin mahdollista: katorakenne ajatellaan harmittomaksi kunkin painotussolun sisällä painojen vaihtelua rajoitettiin, jottei otosvarianssi kasvaisi muuttujia vähän, etteivät analyysit vaikeutuisi Kari Djerf
33
4.2. Painotuksessa käytetyt väestöjakaumat
sisältymistodennäköisyyteen perustuva otospaino miljoonapiiri ja terveyskeskuspiiri korjaa väestörakenteen alueittain oikeaksi ikä ja sukupuoli korjaa po. demograafisen rakenteen oikeaksi äidinkieli suomi+muut, ruotsi Kari Djerf
34
4.3. Painotusmenetelmä: kalibrointi
Hyvin tehokas, regressiomallin hyväksikäyttöön perustuva painotusmenetelmä, joka oikaisee myös kadon aiheuttamaa vinoutta ja tuottaa oikeat väestöjakaumat käytetyistä muuttujista Kehittäjät Deville & Särndal; Deville, Särndal & Sautory (JASA 1992, 1993) CALMAR-niminen SAS-makro-ohjelma Kari Djerf
35
4.4. Painot ja niiden tuottamat jakaumat
Kari Djerf
36
Suuralue Kari Djerf
37
Sosioekonominen asema
Kari Djerf
38
Siviilisääty Kari Djerf
39
4.5. Suosituksia painojen käytöstä
Em. neljää painoa tulisi aina käyttää osajoukoille, jotka määrittelyltään vastaavat parhaiten po. painotusjoukkoa. Jos (lähes) täysi havaintojoukko 7000, käytä UNIONIPAINOA! Jos useiden tutkimusosioiden yhdistelmä ja havaintojen määrä supistunut alle 6000, käytä LEIKKAUSPAINOA! Käytä ohjelmaa, joka hyväksyy otospainot analyyseissa. Kari Djerf
40
Väestön tasolle korottavan painon ohella ns. analyysipaino:
Kokonaismäärien estimoinnissa käytettävä väestön määrään korottavaa painoa. Väestön tasolle korottavan painon ohella ns. analyysipaino: summa vastaajien lukumäärä po. ryhmässä keskiarvo 1 ei vapausasteongelmaa! Huom. analyysipainolla samat ominaisuudet kuin väestöön korottavalla otospainolla, mutta eri skaala. Kari Djerf
41
5. Otanta-asetelman vaikutuksesta analyyseihin
Wolter (1985, Introduction to Variance Estimation Springer) kuvaa kompleksiseen otanta-asetelmaan liittyviä tekijöitä: otosasetelman monimutkaisuus käytettävien estimaattorien kompleksius tutkimusmuuttujien monitahoisuus survey-datan kuvaileva vs. analyyttinen käyttö tutkimuksen laajuus Kari Djerf
42
Kahden ensinmainitun tekijän suhteen:
Estimaattori Asetelma Yksinkertainen Kompleksi Lineaarinen a b Epälineaarinen c d Perusotantateoria käsittelee tapausta a, mutta useimmat survey-tutkimukset kuuluvat ryhmiin b, c tai d. T2000: b ja d . Kari Djerf
43
5.1. Otanta-asetelma ja analyysit
Otanta-asetelmaperusteisuus tarkoittaa seuraavien tietojen huomioon ottamista analyysissä ositus: perusjoukon jakaminen pienempiin kiinteisiin osajoukkoihin - ei otantaa ryvästys kiinteiden osajoukkojen sisällä olevat pienemmät otantaa varten muodostetut osajoukot otospaino aineiston palauttaminen perusjoukon suhteita vastaavaksi Kari Djerf
44
Erityisesti täytyy muistaa:
Ositekohtainen analyysi poikkeaa muista tutkimuksen osajoukoista, koska osite on kiinteä. Otosvarianssit estimoidaan ositteittain! Osajoukkokohtaisella (ns. domain) analyysillä tarkoitetaan satunnaisten osajoukkojen tarkastelua, esim. mielivaltaisen luokituksen mukaan. Esim. T2000: sukupuoli, ikä, alue: muu kuin miljoonapiiri, jokin ominaisuus tai riskitekijä jne. Kari Djerf
45
5.2. T2000 -tutkimuksen analyysiasetelma
Analyysien suorittamista varten alkuperäistä asetelmaa on jouduttu muokkaamaan tilasto-ohjelmia varten: 15 suurinta kaupunkia on ns. itse-edustavia ositteita ja niistä tulevat henkilöt katsotaan rypäiksi, terveyshaas-tattelu: 2695 henkilöä eli ryvästä. toisen asteen rypäät (eli poimitut terveyskeskukset) ennallaan, rypäiden lukumäärä 65. Kari Djerf
46
Varianssiestimoinnissa
otosvarianssit estimoidaan ositteittain rypäiden välisen vaihtelun mukaan itse-edustavissa ositteissa vapausasteiden lkm = henkilöiden eli rypäiden lkm - ositteiden lkm eli =2680 toisen asteen rypäissä vapausasteiden lkm = rypäiden lkm - ositteiden lkm = 65-5 = 60 Kari Djerf
47
5.3. Asetelman vaikutus analyysiin Paras tapa arvioida otos- ja estimointiasetelman vaikutusta analyysiin on laskea asetelmakertoimien estimaatteja (Kish 1965): Kari Djerf
48
T2000 -tutkimuksen asetelmakertoimia
Seuraavassa taulukossa on muutamien tutkimusmuuttujien asetelmakertoimien estimaatit otosasetelman mukaan: oletettavasti yksiasteisessa asetelmassa - suurissa kaupungeissa - kertoimet ovat noin 1 2-asteisessa ryväsasetelmassa kertoimet voivat olla mitä vain, mutta (melkein) aina yli 1. Kari Djerf
49
2-asteinen otoksen osa:
Pelkästään tekniset syyt aiheuttavat liian pienen otosvarianssin (vrt. vapausasteiden lukua!) Useimmissa tapauksissa terveyskeskusten alue on suppea: henkilöiden välillä voi olla riippuvuuksia ts. havainnot sisäkorreloituneita asetelman vaikutus ei ole kiinteä, vaan vaihtelee muuttujasta toiseen sisäkorreloituneisuuden mukaan Kari Djerf
50
Kari Djerf
51
Painotuksen vaikutus piste-estimaatteihin
Vaikutus vaihtelee muuttujasta toiseen Iän vaikutus todennäköisesti merkitsevin asia - iästä riippuvat prevalenssit, esim. krooninen sairaus sukupuoli painotettu ei-painotettu + oikea aset. srs miehet (1.0) (0.9) naiset (0.9) (0.8) kaikki (0.8) (0.6) Kari Djerf
52
Painotuksen vaikutus otosvarianssiin
Painotuksen vaikutusta asetelmakertoimiin ja siten estimoinnin tehokkuuteen oli vähäinen, paljon pienempi kuin otosasetelman vaikutus. vaikutus mukana eliminoitu Diastolinen bp Systolinen bp BMI Krooninen sairaus Kari Djerf
53
Kokonaismäärien estimointi
Asetelmakertoimet yleensä huomattavasti suurempia kokonaismäärille kuin keskiarvojen tai muiden mutkikkaampien parametrien tapauksessa, esim. keskiarvo kokonaismäärä lääkärissäkäynnit terveydentila=hyvä krooninen sairaus Kari Djerf
54
5.4. Asetelmapohjaiset analyysiohjelmistot
Yleisimmin käytetyt: SUDAAN, melko monipuolinen pelkästään otosaineistojen analyysiin tarkoitettu ohjelmistot, vanhahtava suositellaan SAS-kutsuttavaa versiota STATA, täysi tilastoanalyysiohjelmisto, jossa eräitä otosasetelmaoptioita Kari Djerf
55
R, muutama asetelmapohjainen analyysi: KTL:ssä kokemusta
SAS v. 7 lähtien muutama asetelmapohjainen analyysi: SURVEYMEANS ja SURVEYREG (v. 7-8) SURVEYFREQ ja SURVEYLOGISTIC (v. 9) SPSS v. 12 Complex Samples lisämoduli: lähinnä kuvailevat analyysit, ei kokemusta WesVar, moderni Windows-ohjelma, ei laajassa käytössä Kari Djerf
56
5.5. Vaihtoehtoisia tapoja
Asetelmapohjaiset analyysit perustuvat haittaparametri-käsitteeseen (nuisance approach) Vaihtoehtoisesti voidaan asetelma tuoda malliin muillakin tavoilla (Lehtonen et al., 2003a ja b; Laiho ja Nieminen, 2004): GEE-estimointimenetelmä, jossa pareittaiset korrelaatiot rypään sisällä voivat poiketa nollasta, mutta oletetaan vakioisiksi kaikissa rypäissä sekamalleissa ryvästason vaikutus voidaan olettaa satunnaisefektiksi Kari Djerf
57
T2000 - TK:n menetelmäraportti, taulukko 6.1
Kari Djerf
58
T2000 - TK:n menetelmäraportti, taulukko 6.2
Kari Djerf
59
T2000 - TK:n menetelmäraportti, taulukko 6
T TK:n menetelmäraportti, taulukko 6.5: Systolinen verenpaine, tutkitaan vyötärönympäryksen ja iän yhdysvaikutuksen merkitsevyyttä Kari Djerf
60
T2000 - TK:n menetelmäraportti, taulukko 6
T TK:n menetelmäraportti, taulukko 6.6: Systolinen verenpaine, tutkitaan vyötärönympäryksen ja sukupuolen yhdysvaikutuksen merkitsevyyttä Kari Djerf
61
Johtopäätökset IID-perusteinen (toisistaan riippumattomien havaintojen) malli 0 tuotti moniparametrisempia malleja kuin ryvästyksen huomioon ottavat malliratkaisut Asetelmaperusteisten ja muiden asetelman huomioon ottavien menetelmien toimivuudessa ei ollut kovin suuria eroja Kari Djerf
62
Lähteet Aromaa, A. & Koskinen, S. (toim.) Terveys ja toimintakyky Suomessa. Terveys tutkimuksen perustulokset. Kansanterveys-laitoksen julkaisuja B3/2002. Helsinki: Kansanterveyslaitos Deville, J.-C., and C.-E. Särndal (1992). Calibration Estimators in Survey Sampling. Journal of the American Statistical Association, Vol. 87, No. 418, 376!382. Deville, J.-C., C.-E. Särndal and O. Sautory (1993). Generalized Raking Procedures in Survey Sampling. Journal of the American Statistical Association, Vol. 88, No. 423, 1013 Kari Djerf
63
Kish, L. 1965. Survey Sampling. New York: Wiley
Laiho, J. & Nieminen, T. (toim.) Terveys tutkimus. Aikuisväestön haastatteluaineiston tilastollinen laatu. Tilastokeskus, Tutkimuksia 239. (painossa). Lehtonen, R., Djerf, K., Härkänen, T. & Laiho, J. 2003a. A Comparison of Design-Based and Model-Based Methods for the Analysis of Complex Health Survey Data: A Case Study. Ottawa: Proceedings of Statistics Canada Methodology Symposium 2002, Modelling Survey Data for Social and Economic Research. Lehtonen, R., Djerf, K., Härkänen, T. & Laiho, J. 2003b. Modelling Complex Health Survey Data: A Case Study. Teoksessa: Höglund, R. Jäntti, M., & Rosenqvist, G. (toim.). Statistics, Econometrics and Society: Essays in Honour of Leif Nordberg. Helsinki: Statistics Finland, Research Reports 238, Wolter, K Introduction to variance estimation. New York: Springer. Kari Djerf
Samankaltaiset esitykset
© 2024 SlidePlayer.fi Inc.
All rights reserved.