Esittely latautuu. Ole hyvä ja odota

Esittely latautuu. Ole hyvä ja odota

RYHMIEN VERTAILU Jouko Miettunen 19.11.2012.

Samankaltaiset esitykset


Esitys aiheesta: "RYHMIEN VERTAILU Jouko Miettunen 19.11.2012."— Esityksen transkriptio:

1 RYHMIEN VERTAILU Jouko Miettunen

2 KAHDEN RYHMÄN VERTAILU

3 Luennon sisältö Luokitellut muuttujat Ristiintaulukko, prosentit
Khiin neliötesti (2-testi) Jatkuvat muuttujat Keskiarvo, t-testi Mediaani, Mann-Whitneyn U-testi

4 Tutkimusongelma Verrataan 2 eri ryhmää tai käsittelyä
sukupuoli, hoitomuoto, opetusmenetelmä, taustatekijä, riskitekijä, sairas/terve, ... ryhmä i = (kuvitteellinen) populaatio, joka koostuu kaikista (henkilöt tms.) käsittelyn i saaneista tilastoyksiköistä (i = 1 tai 2) Testattava nollahypoteesi H0: tutkittava ominaisuus (vastemuuttuja) on jakautunut kahdessa ryhmässä samalla tavalla (ts. ei eroa)

5 Menetelmän valinta (2 ryhmää)
EI, koska laatua mittaava vaste EI, koska vasteen jakauma hyvin vino Voiko keskiarvoa käyttää? Kyllä Ristiintaulukko - prosentit - khiin neliötesti Vertaile keskiarvoja ryhmien välillä - kahden riippumattoman ryhmän t-testi Ilmoita mediaanit - parametriton testi: Mann-Whitneyn testi

6 Kahden ryhmän vertailu
Olkoon X1 = tutkittava ominaisuus osajoukossa 1 ja X2 = tutkittava ominaisuus osajoukossa 2 Käytettävät menetelmät 2 –testi luokkamuuttujille t-testi (symmetrinen jakauma) parametriton Mann-Whitneyn testi (vino jakauma)

7 Jatkuva vai luokiteltu muuttuja?
Ilmiöt ovat usein jatkuvia, muuttujat kuitenkin usein luokiteltuja Luokittelemalla menetetään tietoa selkeytetään tulosten esittämistä Analyysimenetelmät erilaisia

8 Luokitellut muuttujat

9 Suhteellisten osuuksien vertailu
Esimerkki: Koulumenestyksen yhteys itsemurhaan psykoottisilla ja ei-psykoottisilla (Pohjois-Suomen vuoden 1966 Syntymäkohortti, 35-vuotisseuranta ) Alaräisänen ym. Good school performance is a risk factor of suicide in psychoses: a 35-year follow up of the Northern Finland 1966 Birth Cohort. Acta Psychiatr Scand 2006; 114:

10 Ristiintaulukkona Tilastollinen testi on khiin neliötesti
SPSS: Analyze > Descriptive statistics > crosstabs (statistics -> Chi-square)

11 2 -TESTI Voidaanko ristiintaulukon ehdollisten prosenttijakaumien ero selittää satunnaisvaihtelun aiheuttamaksi? Testin nollahypoteesi on muotoa H0: Tutkittavan muuttujan jakaumat ovat samat eri osajoukoissa Testisuureena käytetään ristiintaulukosta laskettavaa 2 –testiä tai Fisherin testiä

12 SPSS: Analyze > Descriptive statistics > crosstabs (statistics -> Chi-square)

13 Esimerkki Pohjois-Suomen 1966 syntymäkohortti
Äidin raskauden aikaisen tupakoinnin yhteys luokiteltuun syntymäpainoon

14 c2 –testi: syntymäpaino kaksiluokkaisena
Pienille otoksille (Jos väh. 20 prosentissa soluista odotettu arvo on alle 5) Fisherin testi

15 c2 –testi: syntymäpaino kolmeluokkaisena

16

17

18 Jatkuvat muuttujat

19 Keskiarvo vai mediaani?
Keskiarvo soveltuu likimain normaalijakautuneelle aineistolle Mikäli aineistossa on paljon poikkeavia arvoja tai se on huomattavan vino, mediaani kuvaa muuttujan jakaumaa paremmin

20 Normaaliuden arviointi
Mikäli mediaani ja keskiarvo eroavat huomattavasti toisistaan, jakauma ei ole normaalijakautunut Huipukkuus (kurtosis) ja vinous (skewness) kuvaavat normaalisuutta Erilaisia tilastollisia testejä normaalisuudelle, visuaalinen arvio on kuitenkin tärkeä (histogrammit ym.)

21 Muuttujien erilaisia jakaumia
B on normaalijakautunut. A on positiivisesti huipukas jakauma C negatiivisesti huipukas jakauma Havainnot ovat kasaantuneet oikealle (jakauma on negatiivisesti vino eli vino vasemmalle)

22 Esimerkki: kouluarvosana
SPSS: analyze > descriptive statistics > frequencies > charts / histogram

23 Arvosana sukupuolen mukaan

24 Määrää mittaava symmetrinen vaste
Vertaile keskiarvoja ryhmissä Tilastollisen merkitsevyyden arvionti Kahden ryhmän tapauksessa kahden riippumattoman ryhmän t-testi SPSS: Analyze > Compare Means > Independent-Samples T-Test

25 Kahden riippumattoman ryhmän keskiarvojen t-testi
Vertaillaan yhden ominaisuuden (muuttujan) keskiarvoja kahdessa eri perusjoukossa tai osajoukossa. Tutkittavan muuttujan oletetaan noudatettavan normaalijakaumaa Tietojenkäsittelyä varten tarvitaan lisäksi muuttuja, joka ilmaisee kummassa osajoukossa mittaus on tehty. Se on ns. ryhmittelymuuttuja (Grouping Variable).

26 t-testin hypoteesit H0: Tutkittavan ominaisuuden keskiarvo (odotusarvo) on yhtä suuri osajoukoissa 1 ja 2. H1: Tutkittavan ominaisuuden keskiarvot ovat erisuuret osajoukoissa 1 ja 2

27 Testisuureen kaavat Testisuureen havaittu arvo voidaan laskea kahdella eri kaavalla kaava A kaava B Kaavassa (A) oletetaan, että hajonta on osajoukoissa saman suuruinen eli tutkittavan ominaisuuden varianssit ovat yhtä suuret Kaavassa (B) tätä oletusta ei tehdä

28 Esimerkki: Pohjois-Suomen 1985-1986 syntymäkohortti

29 SPSS: Analyze > Compare Means > Independent-Samples T-Test

30 SPSS- tulostus Esimerkki: hajonnat eri suuret (kaava B)

31 Parametrittomat menetelmät
Käytetään kun keskiarvo ei ole sopiva tutkittavan jakauman tunnusluku vino jakauma muista poikkeavat havainnot Ei tehdä oletuksia muuttujien todennäköisyysjakaumista parametriton = jakauman muodon määräävistä parametreistä ei lausuta mitään

32 Mann-Whitneyn U testi Verrataan tutkittavan ominaisuuden jakaumaa kahdessa ryhmässä Oletetaan, että tutkittava ominaisuus on mitattu vähintään järjestysasteikolla Testi on tarkka, jos ominaisuus on määrää mittaava Menetelmä perustuu havaintojen järjestyslukujen vertailuun (yhdistetyssä otoksessa)

33 Mann-Whitneyn testin hypoteesit
H0: Tutkittavan ominaisuuden jakaumat ovat samat vertailtavissa ryhmissä H1: Tutkittavan ominaisuuden jakaumat eroavat sijainniltaan

34 Määrää mittaava vino vaste
Ilmoita mediaanit ryhmittäin SPSS: Analyze > Descriptive Statistics > Explore Tilastollisen merkitsevyyden arvionti Kahden ryhmän tapauksessa Mann-Whitneyn testi SPSS: Analyze > Nonparametric Tests > Legacy dialogs > Two Independent Samples

35

36 Mann-Whitneyn testin esimerkki
rank ALLERGIKOT EI ALLERGIAA 7 31,0 4,7 1 11 39,6 5,2 2 16 64,7 6,6 3 17 65,9 18,9 4 18 67,6 27,3 5 19 100,0 29,1 6 20 102,4 32,4 8 21 1112,0 34,3 9 22 1651,0 35,4 10 41,7 12 45,5 13 48,0 14 48,1 15 Tutkitaan yskösten histamiinipitoisuutta Aineisto koostui 22 tupakoijasta 9 allergikkoa 13 oireetonta

37 Mediaanien vertailu: Mann-Whitneyn U-testi

38 Box-plot

39 Esimerkkejä Bottlender et al. Eur Arch Psychiatry Clin Neurosci (2002) 252: 226–231

40 Esimerkki Koponen ym. Suomen Lääkärilehti 2009 2 –testi
Fisherin eksakti testi

41 Lääketieteen opiskelijoiden mielenterveyskysely
LK Kaisa-Maria Eronen ja LK Ville Saari Syventävien opintojen tutkielma Psykiatrian klinikka, Oulun yliopisto 2011 Lääketieteen opiskelijoiden mielenterveyskysely Yleisen lääketieteen 1. (n=101) ja 6. (n=103) vuoden opiskelijoiden SCL:n keskiarvot Studentin t test

42 Lääketieteen opiskelijoiden mielenterveyskysely
LK Kaisa-Maria Eronen ja LK Ville Saari Syventävien opintojen tutkielma Psykiatrian klinikka, Oulun yliopisto 2011 Lääketieteen opiskelijoiden mielenterveyskysely Kliinisen vaiheen lääketieteen (n=232) ja hammaslääketieteen (n=107) opiskelijoiden SCL-keskiarvot Studentin t test

43 Lääketieteen opiskelijoiden mielenterveyskysely
LK Kaisa-Maria Eronen ja LK Ville Saari Syventävien opintojen tutkielma Psykiatrian klinikka, Oulun yliopisto 2011 Lääketieteen opiskelijoiden mielenterveyskysely Opiskelun vaikutus elämänlaatuun Chi2 = , P=0.074 Chi2 = , P<0.001

44 USEAN RYHMÄN VERTAILU

45 Usean ryhmän vertailu Potilasryhmä Ikäryhmä Koulutusaste Sairaala
Siviilisääty Hoitomenetelmä

46 VASTEMUUTTUJAN TYYPIT
Vastemuuttujan tyyppi ratkaisee menetelmän valinnassa Luokkamuuttuja hoito, siviilisääty, jne. Jatkuva muuttuja Pituus, verenpaine, jne. Oireiden lukumäärä Hoitopäivien lukumäärä

47 95% Confidence Interval for Mean
Descriptives Symptom Checklist (SCL-25) masennuspisteet N Mean Std. Deviation Std. Error 95% Confidence Interval for Mean Minimum Maximum Lower Bound Upper Bound married 3958 1,32 ,330 ,005 1,31 1,33 1,00 3,85 cohabiting 1988 1,35 ,362 ,008 1,34 1,37 4,00 single 1851 1,42 ,408 ,009 1,40 1,44 3,92 divorced, separated 351 1,56 ,494 ,026 1,51 1,61 3,69 widow 4 1,73 ,549 ,274 ,85 2,60 1,38 2,54 Total 8152 1,36 ,370 ,004

48 Menetelmän valinta (>2 ryhmää)
EI, koska laatua mittaava vaste EI, koska vasteen jakauma hyvin vino Voiko keskiarvoa käyttää? Kyllä Ristiintaulukko - prosentit - khiin neliötesti Vertaile keskiarvoja ryhmien välillä - varianssianalyysi Ilmoita mediaanit - parametriton testi: Kruskal-Wallisin testi

49 VASTE ON LUOKKAMUUTTUJA
Muodosta ristiintaulukko ryhmittelumuuttujan kanssa SPSS komento: Analyze- Descriptive Statistics - Crosstabs … Muista prosentit Tilastollisen merkitsevyyden arvionti 2 -testi (Chi square) Fisherin testi pienillä aineistoilla pitää erikseen pyytää Exact –napin kautta

50 Analyze > Descriptive Statistics > Crosstabs

51 Esimerkki: Pohjois-Suomen 1966 syntymäkohortti
Tutkitaan lapsuuden (14v.) sosiaaliluokan yhteyttä kahvin ja teen juontiin aikuisena (31v.) Sosiaaliluokka jaettu ammatin mukaan kolmeen luokkaan korkea (I, II), matala (III, IV) ja maanviljelijät (V) kahvin ja teen juonti neljään luokkaan vain kahvia, vain teetä, molempia, ei kumpaakaan

52 tea and coffee drinking
Esimerkki: Pohjois-Suomen 1966 syntymäkohortti tea and coffee drinking

53

54 Khin neliötestin p-arvot

55 Kasanen J ym. Suomen Lääkärilehti 2011; 33: 2339-2343.

56 Lääketieteen opiskelijoiden mielenterveyskysely
LK Kaisa-Maria Eronen ja LK Ville Saari Syventävien opintojen tutkielma Psykiatrian klinikka, Oulun yliopisto 2011 Lääketieteen opiskelijoiden mielenterveyskysely Opiskelun vaikutus elämänlaatuun Chi2 = , P=0.074 Chi2 = , P<0.001

57 Khii2 testi

58 MÄÄRÄÄ MITTAAVA SYMMETRINEN VASTE
Vertaile keskiarvoja ryhmissä Tilastollisen merkitsevyyden arviointi Kahden ryhmän tapauksessa kahden riippumattoman ryhmän t-testi Jos ryhmiä enemmän kuin kaksi: yksisuuntainen varianssianalyysi SPSS -komento: Analyze - Compare Means - One-Way Anova

59 YKSISUUNTAISEN VARIANSSI-ANALYYSIN OLETUKSET
Tutkittava ominaisuus X noudattaa normaalijakaumaa vertailtavissa osapopulaatioissa. Ominaisuuden varianssi on sama kaikissa osapopulaatioissa. Huom. Levenen testi + vaihtoehtoiset testisuureet Osapopulaatiot ovat toisistaan riippumattomia

60 YKSISUUNTAISEN VARIANSSI-ANALYYSIN HYPOTEESIT
H0: Tutkittavan ominaisuuden Y jakaumat ovat samat eri ryhmissä Ryhmittelymuuttuja ei vaikuta vasteen keskimääräiseen arvoon H1: Ominaisuuden jakaumat poikkeavat keskimääräiseltä arvoltaan osajoukoissa Ryhmittelijä vaikuttaa vasteen keskimääräiseen arvoon Ainakin yksi ryhmä poikkeaa muista

61 ESIMERKKI VARIANSSIANALYYSISTÄ
Tutkitaan Pohjois-Suomen 1966 syntymäkohortissa perhetyypin yhteyttä masennusoireisiin 31-vuotiaana Tutkitaan nollahypoteesia: H0: masennusoireiden keskiarvo on sama eri vastaajaryhmissä Vertailtavat ryhmät: naimisissa, avoliitossa, naimaton, eronnut ja leski

62 VARIANSSIANALYYSI SPSS:SSÄ
Analyze - Compare Means - One-Way Anova

63 ESIMERKKEJÄ VARIANSSIANALYYSIN TULOSTUKSESTA
F testi

64 VARIANSSITESTIT Varianssit ovat eri suuruisia, eli ei symmetrinen vaste Voi kokeilla Kruskall-Wallisin testiä !

65 Esimerkki: Pohjois-Suomen 1966 syntymäkohortti
Tutkitaan vuodenajan yhteyttä syntymäpainoon Vuodenajat talvi: joulu-helmi kevät: maalis-touko kesä: kesä-elo syksy: syys-marras Syntymäpaino jatkuva normaalijakautunut muuttuja

66 Esimerkki: Pohjois-Suomen 1966 Syntymäkohortti

67 Esimerkki Viitasalo ym. Suomen Lääkärilehti 2010

68 MONITESTAUSONGELMA Mikäli ryhmien välillä on eroa…
Mikä ryhmä poikkeaa muista? Onko ryhmien A ja C välillä eroa? Entä ryhmien B ja C?

69 Esimerkki: Pohjois-Suomen 1966 Syntymäkohortti

70 Esimerkki, Baldassin et al (2008)
Monivertailun p-arvoja Varianssianalyysin p arvo

71 MÄÄRÄÄ MITTAAVA VINO VASTE
Ilmoita mediaanit ryhmittäin SPSS-komento: Analyze - Decriptive Statistics - Explore Tilastollisen merkitsevyyden arvionti Kahden ryhmän tapauksessa Mann-Whitneyn testi Jos ryhmiä enemmän kuin kaksi, niin Kruskal-Wallisin testi SPSS-komento: Analyze - Nonparametric Tests – (Legacy Dialogs) - K Independent Samples

72 KRUSKAL-WALLISIN TESTIN HYPOTEESIT
H0: Tutkittava ominaisuuden jakaumat ovat samat eri ryhmissä H1: Ominaisuuden jakaumat poikkeavat sijainniltaan Keskimääräisessä arvossa on eroa ryhmien välillä Ainakin yksi ryhmä poikkeaa muista

73 ESIMERKKEJÄ K-W:N TESTISTÄ
Tutkitaan SUISIDI aineiston muuttujaa yksityis (potilaan itsemurhan aiheuttama kuormitus hoitohenkilöstön yksityiselämään). Tutkitaan nollahypoteesia: H0: potilaan itsemurhan aiheuttaman yksityiselämän kuormituksen jakauma on sama eri vastaajaryhmissä Vertailtavat ryhmät: psykiatriset hoitajat, psykiatrit, sisätautilääkärit ja tehohoitajat

74 K-W:N TESTIN TULOSTUS

75 RAPORTOINTI Box on 25. ja 75. persentiilin väli eli kvartiiliväli (inter-quartile range) Musta viiva on mediaani jos laatikkoa enemmän viivan yläpuolella, jakauma on positiivisesti vino jos laatikko on pieni suhteessa ”viiksien väliin” (”whiskers”), jakauma on pos. huipukas - Poikkeavat havainnot merkataan ympyrällä tai tähdellä - ympyrä: yli 1,5 boxin etäisyydellä ja asteriksi yli 3 boxin etäisyydellä boxin reunasta

76 ESIMERKKEJÄ K-W:N TESTISTÄ
Tutkitaan Pohjois-Suomen 1966 Syntymäkohortissa siviilisäädyn ja masennuksen yhteyttä Tutkitaan nollahypoteesia: H0: masennuksen jakauma on sama eri vastaajaryhmissä Vertailtavat ryhmät: naimisissa, avoliitossa, naimaton ja eronnut

77 K-W:N TESTIN TULOSTUS

78

79 Salokangas ym. Suomen Lääkärilehti 2009
***Kruskal–Wallisin testi

80 Teramo ym. Suomen Lääkärilehti 2007

81 Teramo ym. Suomen Lääkärilehti 2007

82 Suomen Lääkärilehti 2006

83 p < 0,05 invasiivisesti hoidetut vs
*p < 0,05 invasiivisesti hoidetut vs. konservatiivisesti hoidetut, # < 0,05 pallolaajennushoito vs. uusi ohitusleikkaus.

84 RIIPPUMATTOMIEN RYHMIEN VERTAILU
/


Lataa ppt "RYHMIEN VERTAILU Jouko Miettunen 19.11.2012."

Samankaltaiset esitykset


Iklan oleh Google