Esittely latautuu. Ole hyvä ja odota

Esittely latautuu. Ole hyvä ja odota

Tilastollinen päättely

Samankaltaiset esitykset


Esitys aiheesta: "Tilastollinen päättely"— Esityksen transkriptio:

1 Tilastollinen päättely
Luottamusvälit ja hypoteesin testaus

2 Tilastollinen päättely
Tilastollinen päättely tarkoittaa perusjoukkoa koskevien päätelmien tekemistä perusjoukosta poimitun otoksen perusteella. Otoksesta laskettuja tuloksia ei voida suoraan yleistää laajempaa perusjoukkoa koskeviksi, vaan päättelyssä täytyy huomioida otantavirheestä aiheutuva epävarmuus. Tilastollinen päättely voi sisältää virhemarginaalien/luottamusvälien laskemista hypoteesien testausta.   Tilastollisen päättelyn käyttöedellytyksenä on, että otos on valittu satunnaisesti asianmukaista otantamenetelmää käyttäen.

3 Otantavirhe Otoksesta lasketut taulukot ja tunnusluvut kuvailevat otosta. Otoksen perusteella voidaan tehdä päätelmiä perusjoukosta jos otos on satunnaisesti valittu. Jos otosta ei ole valittu satunnaisesti, niin sitä pitäisi kutsua näytteeksi. Otoksen perusteella tehtyihin päätelmiin liittyy otantavirheen aiheuttamaa epävarmuutta. Otantavirhe seuraa siitä, että otoksen kokoonpano riippuu sattumasta ja näin ollen otoksesta lasketut tulokset vaihtelevat satunnaisesti otoksesta toiseen. Otantavirhe on luonnollisesti sitä pienempi mitä suurempaa otosta käytetään.

4 Virhemarginaali/Luottamusväli
Jos haluat tietää perusjoukon tunnusluvun arvon ja käytössäsi on otos perusjoukosta, niin paras arvaus perusjoukon tunnusluvun arvoksi on otoksesta laskettu tunnusluku. Otantavirheen aiheuttaman epävarmuuden voit ilmaista virhemarginaalina. Yleensä ilmoitetaan 95 % virhemarginaali. Luottamusväliksi kutsutaan otoksesta lasketun tunnusluvun ympärille muodostettua väliä tunnusluku + virhemarginaali.

5 Esimerkki Mielipidekyselyn mukaan 51 % suomalaisista kannattaa uuden ydinvoimalan rakentamista. Virhemarginaali on 3 prosenttiyksikköä % luottamusväli on siis 48 % - 54 %. Tämä tarkoittaa sitä, että 95 % varmuudella ydinvoimalan kannattajien osuus on välillä 48 % - 54 %.

6 Keskiarvon luottamusväli
Keskiarvon luottamusväliä laskettaessa oletetaan muuttujan arvojen noudattavan perusjoukossa likimain normaalijakaumaa. Jos otoskoko on yli 30, niin normaalijakauma oletuksesta voidaan tinkiä. Jos käytössä ei ole muuta tietoa kuin otoksesta laskettu keskiarvo, niin se on paras arvaus perusjoukon keskiarvoksi. Kun perusjoukon keskiarvo arvioidaan otoskeskiarvon suuruiseksi, niin arvioon liittyy epävarmuus. Epävarmuus ilmoitetaan virhemarginaalina. Yleensä ilmoitetaan 95 % virhemarginaali.

7 Esimerkkejä Lampun kestoiän keskiarvoksi saadaan 100 lampun otoksesta tuntia. Keskihajonnaksi saadaan 150 tuntia. Laskemalla saadaan 95 % virhemarginaaliksi noin 30 tuntia. Kyseisen lampputyypin kestoiän keskiarvon 95 % luottamusväli on siis tuntia tuntia. Annostelukoneen pitäisi pussittaa 500 gramman pusseja. Pussin painon keskiarvo 20 pussin otoksessa on 480,3 grammaa ja keskihajonta 20,0 grammaa. Laskemalla saadaan 95 % virhemarginaaliksi noin 9,4 grammaa. Tavoitearvo 500 grammaa ei mahdu luottamusvälin 471 g g sisään, joten annostelukone on luultavasti väärin säädetty.

8 Perusjoukon odotusarvon luottamusväli
 = perusjoukon keskiarvo x = otoksen keskiarvo kr = luottamustasoon liittyvä kriittinen arvo (katso taulukko alla) s = otoksen keskihajonta [jos perusjoukon keskihajonta tiedetään, käytetään sitä] n = otoskoko    Jos ei tiedetä perusjoukon hajontaa, käytetään t-jakauman kriittisiä arvoja. luottamustaso 95 % 99 % 99,9 % kriittinen arvo (kr) 1,96 2,58 3,30

9 Laskenta

10 Esimerkki (keskiarvon luottamusväli)
Maksalaatikkorasioiden keskimääräistä painoa tarkkailtiin, koska pakkaamohenkilökunnan epäiltiin mussuttavan maksalaatikkoa omiin suihinsa. Pistokokeen omaisesti poimittiin maksalaatikko-rasian joukosta satunnaiset 15 rasiaa ja punnittiin ne. Punnittujen maksalaatikkorasioiden keskipaino oli 378g ja keskihajonta 14g, jonka voidaan olettaa olevan voimassa kaikkien maksalaatikkorasioiden joukossa. Otoksen perusteella voidaan päätellä kaikkien maksalaatikkorasian keskipainon olevan 99% todennäköisyydellä välillä 368,7 g – 387,3 g

11 Prosenttiluvun luottamusväli
Prosenttiluvun luottamusväliä laskettaessa edellytetään, että otoskoon täytyy olla useita satoja. Jos käytössä ei ole muuta tietoa kuin otoksesta laskettu prosenttiluku, niin se on paras arvaus perusjoukon prosenttiluvuksi. Kun perusjoukon prosenttiluku arvioidaan otoksesta lasketun prosenttiluvun suuruiseksi, niin arvioon liittyy epävarmuus. Epävarmuus ilmoitetaan virhemarginaalina. Yleensä ilmoitetaan 95 % virhemarginaali.

12 Esimerkkejä Otoksesta (n=1800) laskettu viallisten tuotteiden osuus on 5,0 % ja virhemarginaali 1,0 prosenttiyksikköä % luottamusväli viallisten osuudelle on 4,0 % -6,0 %. Kyselytutkimuksen otoskoko n=1000 henkilöä. Otoksesta 51 % (p = 0,51) on uuden ydinvoimalan kannalla. Laskemalla saadaan virhemarginaaliksi noin 3 prosenttiyksikköä. Näin ollen 95 % luottamusväli ydinvoiman kannattajien osuudelle on 48 % - 54 %.

13 Prosenttiosuuden luottamusväli
   luottamustaso 95 % 99 % 99,9 % kriittinen arvo (kr) 1,96 2,58 3,30

14 Esimerkki (prosenttiosuuden luottamusväli)
Markkinatutkimuksessa kysyttiin muun muassa tuotemerkkien tunnettavuudesta. Tutkimukseen osallistui 638 henkilöä, joista 215 kertoi tuntevansa ”Removefingers” –oksasilppurin entuudestaan. Lasketaan millä välillä k.o. oksasilppurin tuntevien henkilöiden prosenttiosuus on koko väestössä 95% varmuudella.

15 Laskenta Otoksesta saatu prosenttiosuus  väli [ 30,0% ; 37,4% ]

16 Hypoteesin testaus Hypoteesin testauksen lähtökohtana on nollahypoteesi, joka oletetaan oikeaksi, ellei otoksesta löydy todisteita sitä vastaan. Nollahypoteesi voi koskea esim. keskiarvon tai prosenttiluvun suuruutta. Tällöin nollahypoteesin lähteenä voi olla vallitseva käsitys, teoria, aikaisempi tutkimus, valmistajan ilmoitus jne. Tavallisimmin hypoteesi koskee ryhmien välistä eroa tai muuttujien välistä riippuvuutta. Tällöin nollahypoteesina on ’ei eroa’ tai ’ei riippuvuutta’. Jos otos antaa riittävät todisteet nollahypoteesia vastaan, niin vaihtoehtoinen hypoteesi astuu voimaan.

17 Nollahypoteesi Koska hypoteesin testaus perustuu otokseen, niin virhepäätelmän mahdollisuus on läsnä. Hypoteesin testauksessa toteutuu yksi seuraavista neljästä vaihtoehdosta: Nollahypoteesi on oikeasti totta ja testauksen tuloksena nollahypoteesi jää voimaan (oikea päätös). Nollahypoteesi ei oikeasti ole totta, mutta testauksen tuloksena nollahypoteesi jää voimaan (hyväksymisvirhe). Nollahypoteesi on oikeasti totta, mutta testauksen tuloksena nollahypoteesi päätetään hylätä (hylkäämisvirhe). Nollahypoteesi ei ole oikeasti totta ja testauksen tuloksena nollahypoteesi päätetään hylätä (oikea päätös).

18 Hylkäämisvirhe Nollahypoteesi on perusolettamus ja se on syytä jättää voimaan ellei ole riittäviä todisteita sitä vastaan. Tämän vuoksi hylkäämisvirhettä (nollahypoteesi on oikeasti totta, mutta testauksen tuloksena se päätetään hylätä) pidetään vakavana virheenä, jota ei mielellään tehdä. Hylkäämisvirheen mahdollisuus on seurausta otantavirheestä ja hylkäämisvirheen todennäköisyys voidaan laskea. Hylkäämisvirheen todennäköisyyttä kutsutaan p-arvoksi tai havaituksi merkitsevyystasoksi. Toinen tapa tulkita p-arvo on seuraava: p-arvo on todennäköisyys sille, että havaittu poikkeama nollahypoteesista on sattuman (otantavirheen) aiheuttama.

19 Johtopäätökset Yleisesti käytetty päättelysääntö on seuraavanlainen:
Jos p-arvo on alle 0,05 (5 %), niin nollahypoteesi hylätään. Muussa tapauksessa nollahypoteesi jää voimaan. Päättelysäännössä käytetty 5 % raja onkin kompromissi hylkäämisvirheen ja hyväksymisvirheen välillä. Käytännön tilanteesta riippuen voidaan raja asettaa muunkin suuruiseksi. Jos hylkäämisvirhe koetaan erityisen kohtalokkaaksi, niin rajaksi voidaan asettaa esimerkiksi 1 % tai 0,1 %.

20 Testauksen vaiheet Muotoile nollahypoteesi H0
Määritä vaihtoehtoinen hypoteesi H1 Valitse testi. Laske hylkäämisvirheen todennäköisyys eli p-arvo. (Laskentatapa vaihtelee testattavan hypoteesin mukaan.) Tee johtopäätökset: Hylkää nollahypoteesi, jos p-arvo on pienempi kuin 0,05 (5 %). Muussa tapauksessa nollahypoteesi jää voimaan. Tulkitse tulos selväkielisesti.

21 Yhden otoksen keskiarvon t-testi
Tarkoituksena on selvittää poikkeavatko tutkittavan perusjoukon odotusarvo  ja jokin tietty luku 0 toisistaan. H0 : =0 H1 : 0 Kaksisuuntainen testaus H1 : <0 tai >0 Yksisuuntainen testaus Otos on poimittu satunnaisesti. Muuttuja on suhde- tai välimatka-asteikon muuttuja ja likimain normaalisti jakautunut.

22 Esimerkki Saimin keskimääräinen tikanheittotulos vuonna 2009 oli 37,6.
Saimi heitti huhtikuussa 2010 yhteensä 14 tikkasarjaa keskiarvolla 33,5 ja keskihajonnalla 5,9. Voidaanko sanoa, että Saimi on taantunut tikkojen viskelyssä? H0:  = 37,6 H1:  < 37,6 yksisuuntainen t-testi p-arvo on 0,01100 <0,05 eli nollahypoteesi hylätään Saimi on siis oikeasti taantunut.

23 Esimerkki Leipomo ilmoittaa leivän suolapitoisuudeksi 1,3 %. Kuluttajia edustavan järjestön tutkija asettaa hypoteesit: H0:  = 1,3 (%) H1:  > 1,3 (%) Tutkija valitsee satunnaisesti 20 leivän otoksen. Laboratoriotutkimuksen perusteella saadaan suolapitoisuuden keskiarvoksi 1,5 % ja keskihajonnaksi 0,3 prosenttiyksikköä. Yksisuuntaisen t-testin p-arvoksi saadaan noin 0,004 < 0,050. Näin ollen nollahypoteesi hylätään. Kannattaa huomioida suuri keskihajonta. Leipien suolapitoisuus voi siis vaihdella suuresti leivästä toiseen.

24 Prosenttiluvun testaus
Esimerkki: Puolueen kannatus oli aiemmin 22,8 %. Tutkitaan onko kannatus laskenut. H0: p = 22,8 % H1: p < 22,8 % Satunnaisesti valitussa 800 henkilön otoksessa puolueen kannattajia oli Yksisuuntaisen testin p-arvoksi saadaan 0,076 > 0,050. Nollahypoteesi jää voimaan. Eli kannatus ei ole laskenut.

25 Esimerkki Vircedes Benz (tuttavallisesti Virsu) automerkin markkinaosuus vuonna 2009 oli 6,38%. Tammi-maaliskuussa myytiin kaikiaan autoa, joista 1533 Virsuja. Onko merkin markkinaosuus muuttunut? H0 : p = 6,38 % H1 : p  6,38 % 2-suuntainen %-osuustesti p-arvo on 0,026 < 0,05 eli nollahypoteesi hylätään Virsun markkinaosuus on siis muuttunut.


Lataa ppt "Tilastollinen päättely"

Samankaltaiset esitykset


Iklan oleh Google