Tilastomenetelmät psykiatrisessa epidemiologiassa

Slides:



Advertisements
Samankaltaiset esitykset
Tuloksista rahoitukseen alustusluento osa 2. Tulokset •Tuloksissa tulee kertoa mitä löydettiin alkaen tutkittavien rekrytoinnista, tutkittavan populaation.
Advertisements

Konfirmatorinen faktorianalyysi
Kotihoidon laskenta Päivi Tossavainen Raija Kuronen.
Osakekurssien tekninen analyysi
Tilastollista päättelyä
Psykologisen mittarin rakenteen tilastollinen analysointi
Artikkelin kriittinen arviointi - havainnoivat tutkimukset
Kartoitustulosten havainnollistaminen Case TaY:n kirjasto
Peruskysymys: onko asteikko luonteeltaan luokitteleva vai jatkuva?
RYHMIEN VERTAILU Jouko Miettunen
KAHDEN RYHMÄN VERTAILU
Luento 2: Tilastollisen tutkimuksen peruskäsitteet ja menetelmät
Leikkauspotilaan hyperglykemia
Meta-analyysit Jouko Miettunen, dosentti Psykiatrian klinikka Oulun yliopisto Oulu
TUME II / Tilastollinen osuus
TYTILM1 Tilastolliset menetelmät
TUME II / Tilastollinen osuus
Hypoteesin testeistä Testin valinta perustuu aina tutkimusongelmaan ja kuvailuun (joka perustuu mitta-asteikoihin) Testaus ei koskaan ole itsenäinen, vaan.
Käyttäytymistieteiden laitos
Perusopetuksen huoltajat 2014 Generated on :04.
Toipuminen skitsofreniassa – systemaattinen katsaus ja meta-analyysi
Anna tutki: Naisen asema työelämässä.
Kliiniset kokeet Jouko Miettunen Tutkimuksen kriittinen arviointi
Vain demonstraatio- käyttöön © Menetelmäopetuksen tietovaranto 1 / 8 Ristiintaulukointi Ristiintaulukointia käytetään tutkittaessa kahden luokittelu- tai.
USEAN RYHMÄN VERTAILU Biostatistiikka
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Kaisa Parkkila Systeemitieteiden kandidaattiseminaari – Kevät ”Rakenneyhtälömallinnus sekä.
Tilastoanalyysien merkitys ekologiassa
Mentelmätarjotin - monimuuttujamenetelmät
Finnish Science in International Comparison A Bibliometric Analysis Kommenttipuheenvuoro Outi Krause TKK.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 3 - Outi Somervuori Optimointiopin seminaari - Kevät 2010 The trouble with choice: Studing.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 28 – Tuukka Sarvi Optimointiopin seminaari - Syksy 2005 / 1 Ratkaisu kotitehtävään 28 Tuukka.
Tilastollisia menetelmiä
Elliptiset jakaumat Esitys 6 kpl Tuomas Nikoskinen Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta.
Pariohjelmointi Personal SE - Vesa Oinonen. Yleistä pariohjelmoinnista kaksi ohjelmoijaa istuu saman koneen ääressä ohjelmoimassa samaa ohjelmaa Tavoitteena.
HY/SVY – Kvantitatiivinen metodologia verkossa – Rakenneyhtälöt – Reijo Byman 1/17 INDEX Kvantitatiivinen metodologia verkossa Rakenneyhtälöt Reijo Byman.
Kvantitatiiviset menetelmät
lineaarinen regressio
Organisational justice and health of employees: prospective cohort study M Kivimäki, M Elovainio, J Vahtera, J E Ferrie (2002)
Silmän käyttäytymisen tutkimus ja sovellukset Veikko Surakka Tampere University Computer Human Interaction Group.
Menetelmä Markowitzin mallin parametrien estimointiin (aihe-esittely)
Tilastollinen testaus Χ 2 -testi nelikentässä kaikkein yksinkertaisin lähtökohta tilastolliselle testille Esim. materiaalin (rauta tai pronssi) ja korun.
Korrelaatio Kertoo kahden muuttujan välisestä lineaarisesta yhteydestä eli kuinka hyvin toisen muuttujan avulla voidaan ennustaa toisen muuttujan vaihtelua.
Standardointi tekee eri asteikollisista muuttujista vertailukelpoisia
S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Ohjaamaton oppiminen– Heikki Vesterinen Optimointiopin seminaari - Syksy 2010 Ohjaamaton.
Piste- ja väliestimointi:
Kurssin alustava ohjelma Luento (13.1.) kurssin tavoitteet oheismateriaali ohjelma peruskäsitteet typologian ensimmäinen määrittely.
Tilastollinen testaus Mann-Whitneyn –testiä voidaan käyttää hyvin pienille n 2 ≤ 8 keskikokoisille 9 ≤ n 2 ≤ 20 suurille n 2 ≥ 20 otoksille –voidaan käyttää.
TILASTOTIEDE ARKEOLOGIASSA Har 230h
2 Tutkimuksen suunnittelu
Monimuuttujamenetelmistä Lähtökohtana mallittaa muuttujien välinen riippuvuusrakenne. Rakenne tulee sovellusalan teoriasta. Sopiva analyysi valitaan mallin.
5. Datan käsittely – lyhyt katsaus Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman.
YFIA202 Kvantitatiiviset menetelmät, luento YTT Pertti Jokivuori Syksy luento (Ti )
UNIVERSITY OF TURKU LOGISTINEN REGRESSIOANALYYSI.
Jarl Wahlström MITEN TEHDÄÄN VÄITÖSKIRJA? Psykoterapian monitieteisen tohtorikoulutusohjelman aloitusseminaari
1 Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina klo Porthanian salissa PIV Uusintamahdollisuus rästitentissä ma 15– 17.
UNIVERSITY OF TURKU MONIMUUTTUJAMENETELMÄT SOSIAALITYÖN TUTKIMUKSESSA Leena Koivusilta Turun yliopisto, Sosiaalipolitiikan laitos.
Määrällinen tutkimus.
YFIA202 Kvantitatiiviset menetelmät, luento
Meta-analyysit kertovat skitsofrenian ennusteesta
VARIANSSIANALYYSI.
Havaintoaineiston kuvailusta
Soveltuvuuskoetulosten pisterajat
Parametriset ja Ei-parametriset testit
Probability models and decision analysis : introduction
Tilastolliset tunnusluvut
Export Demand for Technology Industry in Finland Will Grow by 2
Riippuvuustarkastelut
Aineiston kuvaaminen graafisin menetelmin
Luento V. Typologia ja tilastotiede
Luento V. Typologia ja tilastotiede
Esityksen transkriptio:

Tilastomenetelmät psykiatrisessa epidemiologiassa Jouko Miettunen, FT 9.10.2007 Psykiatrian klinikka

Esitelmän aiheet Perusmenetelmiä Ristiintaulukkojen testaaminen Jakaumien tunnusluvut ja testaaminen Korrelaatiokertoimet Monimuuttujamenetelmiä Regressioanalyysit Elinaika-analyysi Varianssianalyysit Faktorianalyysit Muita menetelmiä (Luotettavuuden arviointi) Tilasto-ohjelmat Kirjallisuutta

Perusmenetelmiä

Luokitellut muuttujat Jakaumien vertailu ryhmien välillä Tilastollinen testaaminen Khiin neliötesti, OR, RR Jatkuvat muuttujat Keskiarvojen vertailu ryhmien välillä Studentin t-testi Mediaanien vertailu ryhmien välillä Mann-Whitneyn U-testi Kruskal-Wallisin testi Korrelaatiokertoimet

Jatkuva vai luokiteltu muuttuja? Luokittelemalla menetetään tietoa Usein kuitenkin selkeyttää tulosten esittämistä Analyysimenetelmät erilaisia

Luokittelutapoja Aiemmat tutkimukset Kliiniset kriteerit Aineistoon perustuvat Mediaani, kvartiilit, alin/ylin 10%, jne. Keskiarvo Keskiarvo ± 2 keskihajontaa

Ristiintaulukkojen testaaminen c2 –testi Fisherin tarkka testi (Fisher’s exact test) Epidemiologiassa erityisesti käytössä vetosuhde, ristitulosuhde (odds ratio) riskisuhde (risk ratio)

Esimerkki Pohjois-Suomen 1966 syntymäkohortti Seisomaan oppiminen ja myöhempi psykoottinen sairaus Jatkoanalyysi psykoosipotilaiden joukossa Onko sukurasituksella merkitystä?

c2 –testi Age at standing unsupported * Psychotic disorder until 2001 4074 40 4114 99,0% 1,0% 100,0% 2430 35 2465 98,6% 1,4% 2970 60 3030 98,0% 2,0% 9474 135 9609 Count - 10 months 11 months 12 months + Age at standing unsupported Total healthy any psychosis Psychotic disorder until 2001 c2 –testi

Fisherin tarkka testi Pienille otoksille Age at standing unsupported * Any psychotic 1st degree relative 8 1 9 88,9% 11,1% 100,0% 16 2 18 23 6 29 79,3% 20,7% 47 56 83,9% 16,1% Count - 10 months 11 months 12 months + Age at standing unsupported Total no yes Any psychotic 1st degree relative Fisherin tarkka testi Pienille otoksille - Jos väh. 25 prosentissa soluista odotettu arvo on alle 5

Assosiaation mittaaminen epidemiologiassa Absoluuttinen Riskiero (risk difference) Altistunut – ei-altistunut Suhteellinen Riskisuhde (risk ratio, relative risk, RR) Ristitulosuhde tai vetosuhde (odds ratio, OR) Altistunut / ei-altistunut Eivät kerro sellaisenaan kausaliteetista

= = = Riskisuhde, RR Odds Ratio, OR a / (a + b) c / (c + d) a / b ad Tauti Kyllä Ei Yhteensä Altiste Kyllä a b a + b Ei c d c + d Yhteensä a + c b + c a + b + c + d a / (a + b) c / (c + d) = Riskisuhde, RR a / b ad = = Odds Ratio, OR c / d bc

Lapsella psykoosi Kyllä Ei Yhteensä Vanhemmalla psykoosi Kyllä 24 (5.0%) 459 483 Ei 132 (1.3%) 10319 10451 Yhteensä 156 10451 10934 24 / (24 + 459) = = 3.9 RR 132 / (132 + 10319) 24 / 459 = = 4.1 OR 132 / 10319

Odds Ratio (OR) vai Risk Ratio (RR)? RR tarkempi riskin tunnuslukuna Mikäli yleinen sairaus tulisi käyttää RR:ää OR:ssä on helpompi ottaa huomioon sekoittavat tekijät Mikäli harvinainen sairaus ja iso aineisto OR ≈ RR

Jatkuvat muuttujat

Keskiarvo vai mediaani? Keskiarvo soveltuu likimain normaalijakautuneelle aineistolle Mikäli aineistossa on paljon poikkeavia arvoja tai se on huomattavan vino, mediaani kuvaa muuttujan jakaumaa paremmin

Normaaliuden arviointi Mikäli mediaani ja keskiarvo eroavat huomattavasti toisistaan, jakauma ei ole normaalijakautunut Huipukkuus (kurtosis) ja vinous (skewness) kuvaavat normaalisuutta Normaaliuden testit eivät ole tehokkaita Kolmogorov-Smirnov testi Shapiro-Wilk testi (kun N<50) Tärkein on kuitenkin visuaalinen arvio!

Muuttujien erilaisia jakaumia B on normaalijakautunut. A on positiivisesti huipukas jakauma C negatiivisesti huipukas jakauma Havainnot on kasaantunut oikealle (jakauma on negatiivisesti vino eli vino vasemmalle)

Keskiarvojen vertailu: t-testi

Mediaanien vertailu: Mann-Whitneyn U-testi Pohjois-Suomen 1986 syntymäkohortti 15-16 v.: Toronto Alexithymia Scale

Mediaanien vertailu: Kruskal-Wallisin H-testi Pohjois-Suomen 1966 syntymäkohortti: masennusoireet (SCL-25) Ei testaa varsinaisesti mediaaneja vaan koko jakauman sijaintia (suositeltavaa) Varsinaisesti mediaaneja testataan esim. jakamalla koko aineisto mediaanista kahteen osaan ja verrataan jakaumia ryhmien välillä (esim. tässä koulutuksen mukaan) c2 –testillä.

Korrelaatiokertoimet Pearsonin korrelaatiokerroin Normaalijakautuneille muuttujille Spearmanin korrelaatiokerroin Ei-normaalijakautuneille muuttujille Järjestyskorrelaatiokerroin (mean rank) Tuloksia voi graafisesti esittää korrelaatiodiagrammin avulla

Korrelaatiodiagrammi

Monimuuttujamenetelmät

Lineaarinen regressioanalyysi Selitetään jatkuvaa (tai ainakin välimatka-asteikollista) muuttujaa Selittäviä muuttujia voi olla useita Jatkuvia tai kaksiluokkaisia muuttujia Muuttujien välinen riippuvuus oletetaan lineaariseksi Selittävät muuttujat ei saa liikaa korreloida keskenään (multikollineaarisuus) Selitettävän muuttujan hajonta ei riipu selittävien muuttujien hajonnasta (homoskedastisuus)

Esimerkki Kohortti 1966, 31 v. seuranta Alkoholin käytön (g/pv) ennustaminen Ennustavat muuttujat Sukupuoli Siviilisääty (naimaton tai eronnut, ei/kyllä) Masennus Jatkuva muuttuja (SCL-masennusoireet) Syntymäpaino Jatkuva muuttuja (g)

Esimerkki

Logistinen regressioanalyysi Yleisin tapa ottaa huomioon sekoittavat muuttujat, Erityisesti pitkittäistutkimuksissa Vastemuuttuja (outcome) on kaksiluokkainen (esim. kyllä/ei) Altistemuuttujat (exposure) voivat olla sekä kaksiluokkaisia, useampiluokkaisia että jatkuvia Multinomiaalisessa logistisessa regressioanalyysissa vastemuuttujassa voi olla useita luokkia

Muuttujien valinta, esim. Aiemman tiedon tai ko. aineiston perusteella Sosiodemograafiset muuttujat, esim. sukupuoli, sosiaaliluokka? Malliin mukaan aiemmin tunnetut sekoittavat tekijät? Erityisesti jos vaikuttavat tuloksiin Mukana ei saa olla liikaa muuttujia Riippuu aineiston koosta ja muuttujien jakaumista Mukana ei kannata olla keskenään liikaa korreloivia muuttujia

Esimerkki Pohjois-Suomen vuoden 1966 syntymäkohortti N = 10 934 Runsaasti haastattelu- ja rekisteridataa

Esimerkki Mikä psykoottisilla potilailla ennustaa uutta sairaalahoitoa? N = 158 Altistemuuttujat sukupuoli Isän sosiaaliluokka (1980) Sukurasitus Sairastumisikä Ensimmäisen sairaalahoidon kesto diagnoosi (skitsofrenia / muu psykoosi) Miettunen ym. Nord J Psychiatry 2006; 60: 286-93.

SPSS Output - muuttujat Categorical Variables Codings 48 ,000 96 1,000 14 133 25 93 65 108 50 94 64 I,II III,IV V Fathers social class 1980 no yes Parent has psychotic dg 1972-2000 male female Sex schizophrenia other psych Diagnosis < 1 month > 1 month Length of first hospitalization Frequency (1) (2) Parameter coding

SPSS Output - tulokset Variables in the Equation 1,048 ,375 7,805 1 ,005 2,852 1,367 5,948 -,559 ,366 2,331 ,127 ,572 ,279 1,172 -,047 ,043 1,199 ,274 ,954 ,876 1,038 ,839 ,385 4,740 ,029 2,314 1,087 4,926 ,651 2 ,722 ,309 ,392 ,622 ,430 1,362 ,632 2,934 ,109 ,647 ,028 ,866 1,115 ,314 3,960 ,612 ,513 1,423 ,233 1,845 ,675 5,045 ,488 1,100 ,197 ,657 1,629 Length of 1st hospital.(1) Sex(1) Onset age Diagnosis(1) Father’s Social Class 1980 FSC 1980(1) FSC 1980(2) Parental psychosis(1) Constant B S.E. Wald df Sig. Exp(B) Lower Upper 95,0% C.I.for EXP(B)

Varianssianalyysi Verrataan ryhmien sisäistä ja välistä variaatiota ANOVA Yksi jatkuva selitettävä eli vastemuuttuja MANOVA Useita jatkuvia vastemuuttujia Toistettujen mittausten ANOVA = Repeated measurements ANOVA Samat mittaukset on tehty useaan kertaan samoilta henkilöiltä ANOVA, MANOVA and rANOVA Vain luokiteltuja altisteita ANCOVA, MANCOVA, rANCOVA Myös jatkuvia altisteita

Esimerkki Erot hippokampuksen koossa Pohjois-Suomen 1966 syntymäkohortti Seurantatutkimus 1999-2001 Skitsofreniapotilaat (N=56) vs. terveet verrokit (N=104) Toistettujen mittausten ANCOVA Oikean ja vasemman puolen hippokampusmittauksia käsitellään toistettuina mittauksia

Schizophrenia and Comparison subjects Hippocampus volumes F Sig. Model 1 Within effect: side 20.3 < 0.001 Diagnosis 1.2 0.28 Gender 6.5 0.01 Model 2 Within effect: side 0.81 0.37 Covariate: brain vol. 35.0 < 0.001 Diagnosis < 0.01 0.89 Gender 0.7 0.41 Familial psychosis 1.9 0.17 Perinatal risk 0.8 0.38 Handedness 0.3 0.61 Tanskanen ym. Schizophrenia Research (2005)

Elinaika-analyysi (Survival analysis)

Elinaika-analyysi Tutkitaan aikaa kahden tapahtuman välissä, esim. Syntymästä sairastumiseen Sairastumisesta kuolemaan Uloskirjoittautumisesta uuteen sairaalahoitoon Kaplan-Meierin mallilla arvioidaan tapahtumien todennäkoisyyksiä eri aikapisteissä Käytössä usein kohorttitutkimuksissa

Elinaika-analyysiin tarvittava tieto Tapahtuma (0,1) Aika tapahtumaan (päiviä, kuukausia,…) tai sensurointiin Aineisto voi sensuroitua Seuranta loppuu Menetetään yhteys tutkittavaan (esim. muuttaa muualle) Seurattava henkilö kuolee muusta syystä kuin mikä on tutkimuksen kohteena

Esimerkki Pohjois-Suomen 1966 Syntymäkohortti Mikä ennustaa itsemurhan tekoikää? Otos Suomessa asuvat 16-vuotiaana (N=10,934) Seuranta vuoden 2001 loppuun 58 (0.5%) itsemurhaa 140 (1.3%) muuta kuolemaa 10,736 (98.2%) elossa Ennustajamuuttuja Perhetyyppi syntymähetkellä (parisuhteessa, yksin)

Käyrät voivat kuvata eloonjäämistä (survival) tai toisinpäin piirrettynä vaaraa (hazard) Test Statistics for Equality of Survival Distributions log rank test, p=0.002

Otoskoko voi olla suhteellisen pieni Ryhmien välisen eron, tai trendin erossa, tulisi olla suurinpiirtein sama seurannan ajan käyrien ei tulisi ainakaan mennä ristiin, jos halutaan testata tilastollisesti Otoskoko voi olla suhteellisen pieni Viitteitä, esim. Parmar & Machin: Survival analysis. A practical approach. John Wiley & Sons, 1995.

Sekoittavien tekijöiden huomiointi Itsemurhan ikä ja perhetyyppi Mahdollisia sekoittavia tekijöitä sukupuoli sosiaaliluokka 1966 (I-II,III-IV,V) kouluarvosanojen keskiarvo (14-v.) psykiatrinen diagnoosi (ei, kyllä) rikos (ei, ei-väkivaltainen, väkivaltainen) Coxin regressioanalyysi

SPSS Output - muuttujat Categorical Variable Codings 5425 1 5222 10197 450 783 7823 2041 1975 8672 10019 200 428 1=male 2=female Sex 0=healthy 1=any dg Psych dg 1=I,II 2=III,IV 3=V Fathers Social Class 1966 1=single 2=full Family type 1966 0=no crimes 1=violent 2=nonviolent Criminality Frequency (1) (2)

SPSS Output - tulokset Variables in the Equation ,812 ,340 5,720 1 ,017 2,253 1,158 4,383 2,463 ,303 66,085 ,000 11,740 6,483 21,260 ,728 ,287 6,429 ,011 2,072 1,180 3,637 1,514 2 ,469 ,451 ,715 ,398 ,528 1,570 ,386 6,377 ,536 ,436 1,513 ,219 1,710 ,727 4,018 -,276 ,164 2,825 ,093 ,759 ,550 1,047 3,398 ,183 ,239 ,454 ,276 ,600 1,269 ,521 3,093 -1,011 ,625 2,613 ,106 ,364 ,107 1,239 SEX PSYCH DG FAM TYPE FSC 1966 FSC 1966(1) FSC 1966(2) SCHOOL MARK CRIMES CRIMES(1) CRIMES(2) B SE Wald df Sig. Exp(B) Lower Upper 95,0% CI for Exp(B)

Faktorianalyysi

Kyselylomakkeen kehittäminen Psykologia, psykiatria, hoitotiede, kasvatustiede, sosiologia, … Lomakkeissa usein liki samoja asioita mittaavia kysymyksiä Etsitään muuttujien yhdistelmistä selittävää mallia, tiivistetään tietoa Etsitään tärkeimpiä muuttujia Kysymysten lukumäärä lomakkeessa Mikä on sopiva (riittävä) määrä? Mahdolliset osa-asteikot

Piilevät muuttujat Monia asioita ei voida mitata suoraan Tarvitaan useita samaa ilmiötä mittaavia muuttujia Esim. älykkyys, sosiaalisuus, konservatiivisuus

Faktorianalyysit Eksploratiivinen faktorianalyysi (ja pääkomponenttianalyysi) [EFA (PCA)] vanhimpia monimuuttujamenetelmiä (Spearman 1904) etsitään muuttujien kombinaatioista selitettävää mallia Konfirmatorinen faktorianalyysi [CFA] tutkitaan valmista mallia ja varmistetaan antaako aineisto tukea ko. mallille

Esimerkki Esimerkkinä on psykoosioireita mittaavan PANSS (Positive and Negative Syndrome Scale) -asteikon rakenne (30 muuttujaa) Mittarista on esitetty useita erilaisia faktoriratkaisuja Aineistona on Pohjois-Suomen vuoden 1966 syntymäkohortin psykoottisia henkilöitä jotka osallistuivat haastatteluun 1999-2001 Pieni aineisto (N=85) Muuttujat likert-asteikolla (1-7) Muuttujissa on vaihtelua

- (taulukossa lataus, vain jos >0.3)

Muita menetelmiä Structural Equation Modelling (Rakenneyhtälomallitus) Latent Class Analysis

Rakenneyhtälömallitus Faktorianalyysin ja regressioanalyysin yhdistelmä Jatkuvia ja luokiteltuja altisteita ja vasteita Esitetään mitattujen muuttujien ja piilevien muuttujien suhteet (esim. korrelaatioina) Byrne (2001) Structural Equation Modeling with AMOS: Basic Concepts, Applications, and Programming.

Esimerkki: Mistä hyvinvointi koostuu? McGartland Rubio ym. 2001

Latent class analysis Kehitetty ryhmittelemään henkilöt valittujen piirteiden mukaan Luokittelee ihmiset ryhmiin Kertoo piirteet (säännöt) joilla luokitus tehtiin Verrattavissa klusterianalyysiin Klusterianalyysi ei anna sääntöjä luokitukseen (=mallia) Muthén & Muthén (Alcohol Clin Exp Res, 24, 882-91, 2000)

Esimerkki: Antisosiaalinen käyttäytyminen National Longitudinal Survey of Youth (NLSY) Respondent ages between 16 and 23 Background information: age, gender and ethnicity N=7,326 17 antisocial dichotomously scored behavior items: Damaged property Fighting Shoplifting Stole <$50 Stole >$50 Use of force Seriously threaten Intent to injure Use Marijuana Use other drug Sold Marijuana Sold hard drugs ‘Con’ somebody Stole an Automobile Broken into a building Held stolen goods Gambling Operation Lähde: http://www.ats.ucla.edu/stat/mplus/seminars/lca/default.htm

Esimerkki: Antisosiaalinen käyttäytyminen Damage Property Fighting Shoplifting Stole <$50 Gambling . . . Male C Race Age

Esimerkki: Antisosiaalinen käyttäytyminen

Relationship between class probabilities and age by gender Females Males 16 17 18 19 20 21 22 23 (age) 16 17 18 19 20 21 22 23

Luotettavuuden arviointi

Reliabiliteetin ja validiteetin käsitteitä Reliabiliteetti Kuinka hyvin mittarilla tehty mittaus on toistettavissa (=stabiliteetti) kuinka yhdenmukaisesti kaksi mittaria/mittaajaa arvioi samaa asiaa tai kuinka hyvin mittarin kysymykset mittaa samaa asiaa (=konsistenssi) Validiteetti Kuinka hyvin mittari mittaa sitä mitä sen pitäisi mitata Psykiatriassa reliabiliteetti ja validiteetti on usein vaikeampi saavuttaa kuin somaattisella puolella!

Reliabiliteetti huono Validiteetti huono Reliabiliteetti hyvä Validiteetti huono Reliabiliteetti hyvä Validiteetti hyvä Validiteetti ei voi olla hyvä, jos reliabiliteetti on huono

Reliabiliteetin ja validiteetin käsitteitä Construct validity (=rakennevaliditeetti) onko teoriakäsite riittävästi ja onnistuneesti mitattu? Convergent validity (=yhtenevyys) onnistuuko käsitteen mittaaminen muulla mittarilla Discriminant validity (=erottelu) onnistuuko mittari erottamaan käsitteen muista käsitteistä Blacker & Endicott 2000, Morgan et al. 2001

Reliabiliteetin ja validiteetin käsitteitä Content validity (=sisältövaliditeetti) Kattavatko kysymykset käsitteen riittävästi Face validity (=näennäisvaliditeetti) Vaikuttaako mittari mittaavan sitä mitä on tarkoitus Blacker & Endicott 2000, Morgan et al. 2001

Reliabiliteetin ja validiteetin käsitteitä Criterion validity (=kriteerivaliditeetti) Miten mittari liittyy muihin samaa asiaa mittaaviin kriteereihin, esimerkiksi diagnoosiin Concurrent validity (=samanaikaisvaliditeetti) Kuinka hyvin mittari ennustaa henkilön nykyistä tilaa Predictive validity (=ennustevaliditeetti) Kuinka hyvin mittari ennustaa henkilön tulevaa tilaa Blacker & Endicott 2000, Morgan et al. 2001

Luotettavuuden testaaminen Luokiteltu muuttuja Kappa, yhdenmukaisuus Jatkuva muuttuja Intraclass korrelaatio (arvioiden tai mittausten yhdenmukaisuus) Cronbachin Alpha (kysymyslomakkeen sisäinen yhdenmukaisuus) Voidaan testata joko arvioijien välillä (interrater) tai saman arvioijan kahden eri arvion välillä (test-retest)

Diagnostiseen testiin liittyviä käsitteitä Positiivisen tuloksen ennustearvo (positive predictive value, PPV) Testillä oikein sairaaksi todettujen osuus kaikista testipositiivisista Negatiivisen tuloksen ennustearvo (negative predictive value, NPV) Testillä oikein terveiksi todettujen osuus kaikista testinegatiivisista Herkkyys (sensitivity, se) Testillä oikein tautia sairastaviksi todettujen osuus kaikista kyseistä tautia sairastavista Tarkkuus (specificity, sp) Testillä oikein terveiksi todettujen osuus kaikista kyseistä terveistä Uhari. Duodecim 2004; 120: 935-41.

Arvioija A Kyllä Ei Yhteensä Kyllä a b g1 Ei c d g2 Yhteensä f1 f2 N Arvioija B Arvioija A Kyllä Ei Yhteensä Kyllä a b g1 Ei c d g2 Yhteensä f1 f2 N Reliabiliteetti Havaittu yksimielisyys po = (a+d) / N Sattuman mukaan odotettu yksimielisyys pe = (f1g1+f2g2) / N2 Kappa  = (po-pe) / (1-pe) Validiteetti (Arvioija B on oikeassa eli “kultainen standardi”, Arvioijan A validiteettia arvioijaan) Sensitiivisyys Se = a / f1 Spesivisyys Sp = d / f2 Positiivinen ennustearvo PPV = a / g1 Negatiivinen ennustearvo NPV = d / g2

Arvioija A Kyllä Ei Yhteensä Kyllä 35 15 50 Ei 25 125 150 Arvioija B Arvioija A Kyllä Ei Yhteensä Kyllä 35 15 50 Ei 25 125 150 Yhteensä 60 140 200 Reliabiliteetti Havaittu yksimielisyys po = (35+125) / 200 = 0.80 (80%) Sattuman mukaan odotettu yksimielisyys pe = (50*60+140*150) / 2002 = 0.60 (60%) Kappa  = (0.8-0.6) / (1-0.6) = 0.50 Validiteetti (Arvioija B on oikeassa eli “kultainen standardi”, Arvioijan A validiteettia arvioijaan) Sensitiivisyys Se = 35 / 60 = 0.58 (58%) Spesivisyys Sp = 125 / 140 = 0.89 (89%) Positiivinen testituloksen ennustearvo PPV = 35 / 50 = 0.70 (70%) Negatiivinen testituloksen ennustearvo NPV = 125 / 150 = 0.83 (83%)

ROC -käyrä Receiver Operating Characteristic (ROC) Sensitivity 1 - Specificity

Cronbachin alpha Perustuu varianssianalyysiin Kertoo kuinka yhdenmukaisesti mittarin eri kysymykset mittaavat samaa asiaa (internal consistency) Voidaan tehdä koko mittarille ja erikseen jokaiselle osa-asteikolle

DATA ESIMERKKI VAR1 VAR2 VAR3 VAR4 VAR5... CASE1 0 1 1 2 0 … CASE2 4 5 4 3 3 … CASE3 0 0 1 0 0 … CASE4 2 2 2 2 3 … CASE5 3 1 1 2 3 … . :

Cronbachin alpha On esitetty erilaisia raja-arvoja, sille mikä on riittävä alpha 0.60 – 0.80, esim. 0.70 (Nunnally 1978) Alphan suuruuteen vaikuttaa kysymysten lukumäärä, mitä enemmän sitä suurempi alpha Muuttujien vinous ongelma, samoin jos sama vastaaja vastaa kaikkiin kysymyksiin samoin (=varianssi on tärkeä) Nunnally (1978) Psychometric Theory

Esimerkkiaineisto Pohjois-Suomen vuoden 1966 syntymäkohortin 31-vuotisseuranta TCI (Temperament and Character Inventory) Reward Dependence –alaskaala RD1 – Sentimentality RD3 – Attachment RD4 – Dependence Kaksiluokkaisia muuttujia

RD – koko asteikko RD – 1 Sentimentality RD 3 – Attachment RD – 4 Dependence

Tilasto-ohjelmia SPSS (www.spss.com) SAS (www.sas.com) STATA (www.stata.com) R+ (cran.r-project.org) SUDAAN (www.rti.org/sudaan) Mplus (www.statmodel.com) StatsDirect (www.camcode.com) MetaWin (www.metawinsoft.com)

Käsitteitä Incidence Rate Ratio / Case Fatality Rate Ratio Kahden ilmaantuvuuden / tapauskuoleisuuden suhde Stanzardized Mortality Ratio Havaitut kuolemat / odotetut kuolemat Lisäriski (Attributable Risk, AR) Riskimuuttujan omaavien henkilöiden lisäriski sairauteen Väestön lisäriski (Population Attributable Risk, PAR) Sairaiden osuus väestössä mikä johtuu riskimuuttujasta Attributable Risk Reduction, ARR Riskin väheneminen joka saadaan esim. Tutkittavalla hoidolla tai kun riskimuuttujan vaikutus poistettaisiin Number Needed to Treat, NNT Kuinka paljon pitäisi potilaita pitäisi hoitaa jotta vältyttäisiin yhdeltä vastetapahtumalta (esim. kuolema) NNT = 1 / ARR http://www.vetmed.wsu.edu/courses-jmgay/GlossClinEpiEBM.htm

Yleisiä lähteitä tilastomenetelmiin suomeksi Metsämuuronen. Tutkimuksen tekemisen perusteet ihmistieteissä (2003). Nummenmaa ym. Tutkimusaineiston analyysi (1997). Uhari. Biostatistiikan taskutieto (2002). Uhari & Nieminen. Epidemiologia & Biostatistiikka (2001). SPSS, SAS, jne. Oppaat