Esittely latautuu. Ole hyvä ja odota

Esittely latautuu. Ole hyvä ja odota

Riippuvuustarkastelut

Samankaltaiset esitykset


Esitys aiheesta: "Riippuvuustarkastelut"— Esityksen transkriptio:

1 Riippuvuustarkastelut
Petri Kainulainen

2 Tilastollisen testaamisen vaiheet
Yleistä Hypoteesiparin määrittäminen Testin ja merkitsevyystason valinta Testisuureen ja vapausasteiden laskeminen Johtopäätösten tekeminen

3 Tilastollisen testaamisen vaiheet
Yleistä Tilastollisia testejä käytetään, kun halutaan tutkia muuttujien välisiä riippuvuussuhteita, eli ”Vaikuttaako joku taustamuuttuja tutkittavaan muuttujaan?” ”Onko ryhmien välillä merkitseviä eroja?” Riippuvuuksien tarkastelu tulee aloittaa tilastollisten tunnuslukujen (esim. keskiarvo, osuudet) avulla ”Ovatko erot käytännön kannalta merkittäviä?” Tilastollisilla testeillä haetaan päättelylle varmuutta Saadaan vastaus, onko vaikutus merkitsevä perusjoukossa

4 Tilastollisen testaamisen vaiheet
Perusjoukko Otos Johtopäätökset Otos on edustava pienoiskuva perusjoukosta Johtopäätökset perusjoukosta tehdään otoksen perusteella (yleistys)

5 Tilastollisen testaamisen vaiheet
1. Hypoteesiparin määrittäminen Tieteellinen hypoteesi: ”Teoriasta johdettu olettamus ilmiön toiminta- mekanismista, jota testataan empiirisellä aineistolla.” Tilastollinen hypoteesi: ”Otoksen perusteella tehtävä olettamus perusjoukon jakaumasta ja tunnusluvuista”

6 Tilastollisen testaamisen vaiheet
Tutkimusta suunniteltaessa tulee miettiä tutkimusongelma (esim. onko uudella lääkkeellä verenpainetta alentava vaikutus), joka muotoillaan tilastolliseksi hypoteesipariksi Nollahypoteesi (merkitään H0) on olemassa oleva ja aikaisemmin oikeaksi todistettu ilmiön tila, jonka pitävyyttä halutaan tutkia (esim. uudella lääkkeellä ei ole verenpainetta alentavaa vaikutusta – ennen kuin toisin todistetaan) Nollahypoteesi halutaan usein hylätä

7 Tilastollisen testaamisen vaiheet
Vastahypoteesi (merkitään H1) on uusi ilmiön tila, jonka toivotaan korvaavan vanha, olemassa oleva käsitys (esim. uudella lääkkeellä on verenpainetta alentava vaikutus) Vastahypoteesin toivotaan ”astuvan voimaan” Hypoteesipari on näiden kahden muodostama kokonaisuus ja ilmaistaan yleensä seuraavasti: H0: vakiintunut käsitys H1: uusi käsitys Hypoteesipari voidaan kirjoittaa sekä sanallisesti että matemaattisin merkinnöin

8 Tilastollisen testaamisen vaiheet
2. Testin ja merkitsevyystason valinta Tilastollisen testin valintaan vaikuttaa Muuttujan mitta-asteikko (käytännössä monivalintakysymys vs. numeerinen kysymys) Muuttujan jakauma (käytännössä numeerisen kysymyksen osalta normaalijakauma) Kahden monivalintakysymyksen välinen riippuvuus: pääsääntöisesti χ2-riippumattomuustesti Monivalintakysymyksen ja numeerisen kysymyksen välinen riippuvuus: pääsääntöisesti riippumattomien otosten t-testi Merkitsevyystaso: todennäköisyys sille, että testin perusteella tehdään perusjoukosta väärä johtopäätös Yleisesti hyväksytty merkitsevyystaso on 5 %

9 Tilastollisen testaamisen vaiheet
3. Testisuureen ja vapausasteiden laskeminen Yleensä testin perustana on havaintoaineistosta laskettu testisuure, joka noudattaa jotain tiettyä jakaumaa Testisuureen jakaumasta saadaan vapausasteiden (lasketaan myös aineiston perusteella) avulla niin sanotut kriittiset arvot, joihin aineiston perusteella laskettua testisuuretta verrataan Jos testisuureen arvo on ”harvinaisen” suuri tai pieni, yleensä päädytään nollahypoteesin hylkäämiseen

10 Tilastollisen testaamisen vaiheet
4. Johtopäätösten tekeminen Jos testisuureen arvo on riittävän harvinainen, nollahypoteesi hylätään, eli se ei pidä paikkaansa Χ2-riippumattomuustestissä: jos testisuureen arvo on suurempi kuin kriittinen arvo Riippumattomien otosten t-testissä: jos testisuureen arvo on pienempi kuin miinus-merkkinen kriittinen arvo tai suurempi kuin plus-merkkinen kriittinen arvo Muutoin nollahypoteesi jää voimaan Nollahypoteesi voidaan muotoilla raporttiin väittämäksi Tilastollinen ohjelmisto (SPSS) laskee niin sanotun p-arvon, jota verrataan merkitsevyystasoon p-arvon tulkinta: ”Jos p-arvo on pienempi kuin merkitsevyystaso (5 %), niin nollahypoteesi hylätään.”

11 Tilastollisen testaamisen vaiheet
χ2-jakauman tiheysfunktio, vapausastein 3 t-jakauman tiheysfunktio, vapausastein 100 H0 pitää paikkansa H0 pitää paikkansa H0 ei pidä paikkaansa H0 ei pidä paikkaansa

12 Tilastollisen hypoteesin testaaminen
χ2 –riippumattomuustesti Riippumattomien otosten t-testi Muita menetelmiä

13 Tilastollisen hypoteesin testaaminen
χ2-riippumattomuustesti Testiä käytetään, kun halutaan selvittää, riippuvatko kaksi muuttujaa (monivalintakysymystä) toisistaan (esim. kokeen arvosana sukupuolesta) Testin suorittamista varten muodostetaan niin sanottu ristiintaulukko (tai kontingenssitaulukko) Riippumattomuustestin hypoteesipari on muotoa H0: tarkasteltavat kaksi muuttujaa eivät riipu toisistaan H1: tarkasteltavilla kahdella muuttujalla on riippuvuussuhde

14 Tilastollisen hypoteesin testaaminen
Esimerkki Aineistona MOTV menetelmäopetuksen aineisto: World Value Survey 1996, osa Suomen aineistosta (lähde: fosawvs.html) n = 987, useita muuttujia eri elämänalueilta. Tutkimusongelmana, vaikuttaako vastaajan sukupuoli koettuun terveydentilaan (1 = hyvä, 2 = kohtalainen, 3 = huono). Laaditaan ensin tutkimusongelmasta ristiintaulukko

15 Tilastollisen hypoteesin testaaminen
Sukupuolen ja koetun terveydentilan välinen ristiintaulukko, jossa on lukumäärien (frekvenssit) lisäksi rivi- ja sarakeprosentit. Sukupuoli Yhteensä Mies Nainen Millainen on tämänhetkinen terveydentilanne? Hyvä 343 48,7 % 71,9 % 361 51,3 % 71,6 % 704 100 % 71,8 % Kohtalainen 100 46,7 % 21,0 % 114 53,3 % 22,6 % 214 21,8 % Huono 34 54,0 % 7,1 % 29 46,0 % 5,8 % 63 6,4 % 477 48,6 % 504 51,4 % 981

16 Tilastollisen hypoteesin testaaminen
Ristiintaulukon perusteella voidaan tarkastella riippuvuussuhdetta (sukupuoli vs. terveydentila) silmämääräisesti prosenttien avulla. Riviprosenttien tulkinta: ”Hyvänä terveydentilansa pitäneistä 48,7 % oli miehiä ja 51,3 % naisia.”. Sarakeprosenttien tulkinta: ”Miehistä 71,9 % pitää terveydentilaansa hyvänä. Vastaava luku naisille on 71,6 %.”. Päätös rivi- ja/tai sarakeprosenttien käyttämisestä tehdään sen perusteella, millä tavalla tulos halutaan ilmaista. Tämän tutkimusongelman suhteen sarakeprosentteja on helpompi tulkita. Sukupuolten välillä ei näytä olevan suurta eroa.

17 Tilastollisen hypoteesin testaaminen
Esimerkki jatkuu Tilastollisen testaamisen vaiheet: Hypoteesiparin määrittäminen H0: ”Sukupuoli ei vaikuta kokemukseen terveydentilasta, eli miesten ja naisten välillä ei ole merkitsevää eroa.” H1:”Sukupuoli vaikuttaa kokemukseen terveydentilasta, eli joko miehet tai naiset kokevat terveydentilansa paremmaksi.” Testin ja merkitsevyystason valinta Molemmat muuttujat ovat luokittelevia (monivalintakysymyksiä) => χ2 –riippumattomuustesti Testin merkitsevyystasoksi valitaan aina 5 % (0,05) Testisuureen ja vapausasteiden laskenta

18 Tilastollisen hypoteesin testaaminen
Testisuureen laskentaa varten tarvitaan kunkin ristiintaulukon solun odotettu frekvenssi, joka tarkoittaa, ”Kuinka monta havaintoa kussakin solussa tulisi olla, jotta nollahypoteesi pitää paikkansa?”. Kunkin solun odotettu frekvenssi saadaan laskettu havaittujen frekvenssien avulla seuraavasti Muuttuja 1 Yhteensä Luokka 1 Luokka 2 Muuttuja 2 e11 e12 e1+ e21 e22 e2+ Luokka 3 e31 e32 e3+ e+1 e+2 n

19 Tilastollisen hypoteesin testaaminen
Esimerkissä Sukupuoli Yhteensä Mies Nainen Millainen on tämänhetkinen terveydentilanne? Hyvä 704 Kohtalainen 214 Huono 63 477 504 981

20 Tilastollisen hypoteesin testaaminen
χ2-testisuure saadaan laskettua vertaamalla odotettuja ja havaittuja frekvenssejä toisiinsa Jos odotettujen ja havaittujen frekvenssien välinen ero on pieni, muuttujat eivät riipu toisistaan Testisuure saadaan laskettua seuraavan kaavan avulla missä oij = i:nnen rivin ja j:nnen sarakkeen havaittu frekvenssi eij = i:nnen rivin ja j:nnen sarakkeen odotettu frekvenssi r = rivien lukumäärä c = sarakkeiden lukumäärä testisuure noudattaa Χ2-jakaumaa vapausastein df = (r - 1)(c - 1)

21 Tilastollisen hypoteesin testaaminen
Esimerkissä Testisuureen arvo: Vapausasteet: df = (3-1)(2-1) = 2

22 Tilastollisen hypoteesin testaaminen
Tilastollisen testaamisen vaiheet: Johtopäätösten tekeminen Laskettua testisuuretta tulee verrata χ2-jakaumasta saatavaan kriittiseen arvoon (poimitaan yleensä taulukosta) Jos testisuureen arvo on suurempi kuin kriittinen arvo (odotetut ja havaitut frekvenssit poikkeavat paljon toisistaan), nollahypoteesi ei pidä paikkaansa Jos testisuureen arvo on pienempi kuin kriittinen arvo (odotetut ja havaitut frekvenssit eivät poikkea paljoa toisistaan), nollahypoteesi pitää paikkansa

23 Tilastollisen hypoteesin testaaminen
Esimerkissä χ2-jakauman kriittisiä arvoja χ2-jakauman tiheysfunktio α df 0.05 0.01 1 3.841 6.635 2 5.991 9.210 3 7.815 11.345 4 9.488 13.277 5 11.070 15.086 6 12.592 16.812 7 14.067 18.475 H0 pitää paikkansa Testisuureen arvo H0 ei pidä paikkaansa

24 Tilastollisen hypoteesin testaaminen
Johtopäätös esimerkissä Testisuureen arvo (1,031) on selkeästi pienempi kuin jakaumasta saatu kriittinen arvo (7,815), joten nollahypoteesi pitää paikkansa. Sukupuoli ei siis vaikuta koettuun terveydentilaan. Tämä väittämä voidaan kirjoittaa raporttiin ristiintaulukosta saatavien prosenttien lisäksi. Väitteen tueksi, esitetään tilasto-ohjelmasta saatava p-arvo, jonka tulkintaan tutustutaan SPSS-harjoituksissa.

25 Tilastollisen hypoteesin testaaminen
Riippumattomien otosten t-testi Jos halutaan tutkia, poikkeaako kahden toisistaan riippumattoman populaation (esim. miehet ja naiset) keskiarvot, voidaan käyttää t- testiä Molempien populaatioiden tulee noudattavat likimain normaalijakaumaa ja muuttujan tulee olla vähintään välimatka- asteikollinen (siis jatkuva) Perusjoukon parametreja merkitään seuraavasti μ1 ja μ2 = ryhmän 1 ja 2 perusjoukon keskiarvo Hypoteesipari (kaksisuuntainen hypoteesi) voidaan kirjoittaa muotoon H0: μ1 = μ2 (perusjoukon keskiarvot yhtä suuret) H1: μ1 ≠ μ2 (perusjoukon keskiarvot poikkeavat)

26 Tilastollisen hypoteesin testaaminen
Esimerkki Aineistona MOTV menetelmäopetuksen aineisto: World Value Survey 1996, osa Suomen aineistosta (lähde: vs.html) n = 987, useita muuttujia eri elämänalueilta. Tutkimusongelmana, vaikuttaako vastaajan ikä koettuun terveydentilaan (1 = hyvä, 2 = kohtalainen/huono). Ikä on siis jatkuva muuttuja ja koettu terveydentila luokitteleva Erojen tarkastelu aloitetaan laskemalla tilastolliset tunnusluvut (iän keskiarvo ja keskihajonta) molemmille koetun terveydentilan luokalle erikseen

27 Tilastollisen hypoteesin testaaminen
Koettu terveydentila = Hyvä n = 704 keski-ikä = 37,67 iän keskihajonta = 14,89 Koettu terveydentila = Kohtalainen/huono n = 277 keski-ikä = 53,69 iän keskihajonta = 15,86 Tunnuslukujen perusteella näyttää siltä, että hyvän terveydentilan omaavat ovat nuorempia.

28 Tilastollisen hypoteesin testaaminen
Esimerkki jatkuu Tilastollisen testaamisen vaiheet: Hypoteesiparin määrittäminen H0: ”Ikä ei vaikuta kokemukseen terveydentilasta” H1:”Ikä vaikuttaa kokemukseen terveydentilasta” Testin ja merkitsevyystason valinta Toinen muuttujista on jatkuva ja toinen luokitteleva (oletetaan, että ikä noudattaa normaalijakaumaa) => riippumattomien otosten t-testi Testin merkitsevyystasoksi valitaan aina 5 % (0,05) Testisuureen ja vapausasteiden laskenta

29 Tilastollisen hypoteesin testaaminen
Testisuure saadaan laskettua seuraavan kaavan avulla missä yhteinen keskihajonta s saadaan laskettua ryhmien keskihajonnoista seuraavasti Testisuure noudattaa t-jakaumaa vapausastein df = n1 + n2 – 2 ja kriittiset arvot löytyvät Studentin t-jakaumaa koskevista taulukoista.

30 Tilastollisen hypoteesin testaaminen
Esimerkissä Yhteinen keskihajonta Testisuureen arvo Vapausasteet

31 Tilastollisen hypoteesin testaaminen
Tilastollisen testaamisen vaiheet: Johtopäätösten tekeminen Laskettua testisuuretta tulee verrata t-jakaumasta saataviin kriittisiin arvoihin (poimitaan yleensä taulukosta) Jos testisuureen arvo on suurempi kuin + -merkkinen kriittinen arvo tai pienempi kuin - -merkkinen kriittinen arvo, nollahypoteesi ei pidä paikkaansa Jos testisuureen arvo on pienempi kuin + -merkkinen kriittinen arvo ja suurempi kuin - -merkkinen kriittinen arvo kriittinen arvo, nollahypoteesi pitää paikkansa

32 Tilastollisen hypoteesin testaaminen
Esimerkissä t-jakauman kriittisiä arvoja α df 0.025 0.005 1 12.706 63.657 2 4.303 9.925 3 3.182 5.841 4 2.776 4.604 5 2.571 4.032 6 2.447 3.707 7 2.365 3.499 8 2.306 3.355 9 2.262 3.250 ……. inf 1.960 2.576 t-jakauman tiheysfunktio H0 pitää paikkansa Testisuureen arvo H0 ei pidä paikkaansa

33 Tilastollisen hypoteesin testaaminen
Johtopäätös esimerkissä Testisuureen arvo (-14,89) on selkeästi pienempi kuin jakaumasta saadun kriittisen arvon - -merkkinen luku (-1,96), joten nollahypoteesi ei pidä paikkaansa. Ikä siis vaikuttaa koettuun terveydentilaan. Suunnan voi päätellä keskiarvojen perusteella => nuoremmat kokevat terveydentilansa paremmaksi. Tämä väittämä voidaan kirjoittaa raporttiin keskiarvojen lisäksi. Väitteen tueksi, esitetään tilasto-ohjelmasta saatava p-arvo, jonka tulkintaan tutustutaan SPSS-harjoituksissa.


Lataa ppt "Riippuvuustarkastelut"

Samankaltaiset esitykset


Iklan oleh Google