Lataa esitys
Esittely latautuu. Ole hyvä ja odota
JulkaistuKai Saarinen Muutettu yli 6 vuotta sitten
1
TUTKIMUSKURSSI I (407040A-02), OSA A), KVANTITATIIVISEN TUTKIMUKSEN PERUSKURSSI, TILASTOLLISET ANALYYSIMENETELMÄT Jouni Peltonen, 2016 ktk331 Jouni Peltonen
2
Miten kurssi suoritetaan, perustapaus:
-TA-luentosarja ja harjoitusryhmät suoritetaan yhtenä kokonaisuutena (3 op) tekemällä joukko tilastoaineiston analyysiin liittyviä tehtäviä -analyysitehtäviä ja vuokaaviotehtävä Jouni Peltonen
3
Jos suoritat vain TA-luentosarjan (-02)
-tee ensimmäisen pienryhmäkerran tehtävä- Kokonaisuus ja -joukko luentosarjaan perustuvia analyysitehtäviä ja vuokaaviotehtävä Jos suoritat vain harjoitusryhmät -tee joukko tietokonepohjaisia analyysitehtäviä Jouni Peltonen
4
-yksiulotteisen jakauman kuvaaminen
TA-luentosarja: -johdanto -yksiulotteisen jakauman kuvaaminen -kaksiulotteisen jakauman kuvaaminen -tilastollisen päättelyn perusteita -estimointi -tilastollinen testaus Jouni Peltonen
5
(1) tietojen hankinnan suunnittelu ja toteuttaminen,
1. JOHDANTO 1.1 Mitä tilastotiede on Empiirinen tutkimus: (1) tietojen hankinnan suunnittelu ja toteuttaminen, (2) aineiston analysointi, joka voidaan jakaa kahteen tilastotieteen osa-alueeseen (a) kuvailu ja (b) päättely ja (4) tulosten esittäminen. Jouni Peltonen
6
2. OTANTA JA OTANTAMENETELMÄT 2.1. Otantaan liittyvät peruskäsitteet
2.1. Otantaan liittyvät peruskäsitteet -perusjoukko eli populaatio (population) -kokonaistutkimus ja otantatutkimus -otos (sample) ja otanta (sampling) -näyte Jouni Peltonen
7
2. OTANTA JA OTANTAMENETELMÄT 2.1. Otantaan liittyvät peruskäsitteet
2.1. Otantaan liittyvät peruskäsitteet -perusjoukko eli populaatio (population) -kokonaistutkimus ja otantatutkimus -otos (sample) ja otanta (sampling) -näyte Jouni Peltonen
8
(1) perusjoukko on hyvin suuri tai ääretön,
Otantatutkimus, jos (1) perusjoukko on hyvin suuri tai ääretön, (2) koko perusjoukon tutkiminen maksaisi liikaa, kestäisi pitkään tai olisi liian monimutkaista (3) mittaus tuhoaa tutkittavat yksiköt ja/tai (4) ei-otantavirheet saadaan näin pienenemään Edustava otos ja harhainen otos, demonstraatio Jouni Peltonen
9
Edustavuusanalyysi, esimerkki:
Jouni Peltonen
10
Edustavuusanalyysi, esimerkki:
Jouni Peltonen
11
2.3.1. Yksinkertainen satunnaisotanta (YSO) (Simple random sampling)
2.3. Otantamenetelmät Yksinkertainen satunnaisotanta (YSO) (Simple random sampling) Esimerkki YSO:sta: Jouni Peltonen
12
2.3.2. Systemaattinen otanta (SO) (systematic sampling)
Esimerkki SO:sta: Jouni Peltonen
13
Aloituskohta arvotaan koko listasta 1. poimintavälistä.
k = N/n = 12/4 = 3, joka kolmas havainto- yksikkö poimitaan. Aloituskohta arvotaan koko listasta 1. poimintavälistä. Nimi Poiminta A B C D E F G H 9. I J 11. K 12. L Jouni Peltonen
14
Nimi Poiminta A B C D E F G H 9. I J 11. K 12. L Jouni Peltonen
15
Nimi Poiminta A B X C D E F G H 9. I J 11. K 12. L Jouni Peltonen
16
X A B C D E F G H 9. I J 11. K 12. L MIHIN TÄTÄ ENÄÄ TARVITAAN? Nimi
Poiminta A B X C D E F G H 9. I J 11. K 12. L MIHIN TÄTÄ ENÄÄ TARVITAAN? Jouni Peltonen
17
Nimi ja ikä Poiminta A 18 B 21 X C 22 D 25 E 29 F 32 G 37 H 41 9. I 45 J 50 11. K 55 12. L 62 Jouni Peltonen
18
2.3.3. Ositettu otanta (OO) (stratified sampling) Tasainen kiintiöinti
Tasainen kiintiöinti Jokaisesta ositteesta poimitaan otokseen yhtä monta havaintoa eli n1 = n2 = ... = nL = n/L. Esimerkki: Jouni Peltonen
19
2.3.3. Ositettu otanta (OO) (stratified sampling) Tasainen kiintiöinti
Tasainen kiintiöinti Jokaisesta ositteesta poimitaan otokseen yhtä monta havaintoa eli n1 = n2 = ... = nL = n/L. Esimerkki: Jouni Peltonen
20
Suhteellinen kiintiöinti
Suhteellinen kiintiöinti Ositteiden otoskoot määrätään perusjoukon suhteessa. Suuresta ositteesta valitaan suuri otos ja pienestä ositteesta pieni. Ositteen i otoskoko voidaan määrätä seuraavalla kaavalla: Jouni Peltonen
21
Esimerkki: N = 7000 n = 300 L1: N1 = 379 L2: N2 = 6621 Jouni Peltonen
22
Otos, suhteellinen kiintiöinti:
Perusjoukko: Otos, suhteellinen kiintiöinti: Otos, tasainen kiintiöinti: Jouni Peltonen
23
2.3.4. Ryväsotanta (RO) (cluster samplig)
Poiminta on yksi- tai monivaiheista: (1) Valitaan havaintoyksikköä suurempia kokonaisuuksia ja tutkitaan näin saatuihin ryppäisiin kuuluvat havaintoyksiköt tai (2) Valitaan suurempia kokonaisuuksia (esimerkiksi kouluja, koululuokkia) ja tämän jälkeen suoritetaan valituksi tulleiden ryppäiden sisällä uusi varsinaisiin havaintoyksikköihin kohdistuva otanta. Jouni Peltonen
24
Esimerkki: N = 500, IQ kiinnostaa Jos YSO, n = 30
Jos ryväsotanta, neljä ryvästä, n 100 ͌ Jouni Peltonen
25
Poimitaan neljä arvottua ryvästä:
1) Jos ryvästyminen on tutkittavien ominaisuuksien suhteen sattumavaraista Poimitaan neljä arvottua ryvästä: vrt. Jouni Peltonen
26
Poimitaan neljä arvottua ryvästä:
2) Jos ryvästyminen ei ole tutkittujen ominaisuuksien suhteen sattumanvaraista: Poimitaan neljä arvottua ryvästä: vrt. Jouni Peltonen
27
3.TAUSTAA Kvantitatiivisen/ tilastollisen aineiston ANALYYSILLE
3.1. Mittaus ja mitta-asteikot Havainto- tai tilastoyksikkö, tilastollinen muuttuja ja mittaus Jouni Peltonen
28
-havainnointi on mittausta
-havainnointi on mittausta -mittauksen kohde on havainto- tai tilastoyksikkö ai, erityisesti jokin siihen liittyvä ominaisuus x, y, z, … Näitä ominaisuuksia kutsutaan tilastollisiksi muuttujiksi. -mittaustapahtumassa tilastoyksikön ai ominaisuuteen eli tilastolliseen muuttujaan xj liitetään mittaluku tai mittasymboli xij. Jouni Peltonen
29
-esimerkkejä mittaustapahtumasta:
-esimerkkejä mittaustapahtumasta: Jouni Peltonen
30
Mittaustulokset kootaan yleensä havaintomatriisiin:
Mittaustulokset kootaan yleensä havaintomatriisiin: Jouni Peltonen
31
-mittari eli mittafunktio: -sääntö tai sääntökokoelma, ohje, neuvo
-mittari eli mittafunktio: -sääntö tai sääntökokoelma, ohje, neuvo Jouni Peltonen
32
Mitta-asteikot Jouni Peltonen
33
(A) luokitteluasteikko:
(A) luokitteluasteikko: Jouni Peltonen
34
(B) Järjestysasteikko:
(B) Järjestysasteikko: Jouni Peltonen
35
Esimerkki 3. 5, sidoksen käsite
Esimerkki 3.5, sidoksen käsite. On mitattu järjestysasteikollinen tuntiaktiivisuus-muuttuja, tehdään raaka-arvoille muunnos järjestysluvuiksi: Jouni Peltonen
36
Esimerkki 3. 5, sidoksen käsite
Esimerkki 3.5, sidoksen käsite. On mitattu järjestysasteikollinen tuntiaktiivisuus-muuttuja, tehdään raaka-arvoille muunnos järjestysluvuiksi: R(x) (x) 4,5 3 1,5 1,5 6 4,5 7 8,5 8,5 Jouni Peltonen
37
(C) Välimatka-asteikko:
(C) Välimatka-asteikko: Jouni Peltonen
38
(C) Suhdeasteikko ja absoluuttinen asteikko:
(C) Suhdeasteikko ja absoluuttinen asteikko: Jouni Peltonen
39
-"suhdesuureet", pinta-ala jne.
johdetut suureet: -"suhdesuureet", pinta-ala jne. -myös summamuuttujaa voi ajatella johdettuna suureena! Moniulotteiset suureet eli vektorisuureet Joissain tapauksissa mittaustaso voi asettua edellä esitettyjen asteikkojen väliin! Erityiskysymys: Likert-skaalan tuottaman aineiston mitta-asteikko? Jouni Peltonen
40
4. MUUTTUJIEN KUVAAMINEN
4. MUUTTUJIEN KUVAAMINEN Huomio: kaikki empiirinen "tieto" on jo olemassa havaintomatriisissa! Jouni Peltonen
44
Jouni Peltonen
46
Miten valita tilastollinen/graafinen esitystapa?
Miten valita tilastollinen/graafinen esitystapa? (1) mitä taulukon tai kuvion avulla halutaan sanoa ja (2) mille mittaustasolle tai mitta-asteikoille sopii mikäkin esitys. Jouni Peltonen
47
4.1.1. Yksiulotteinen frekvenssijakauma eli suora jakauma
Yksiulotteinen frekvenssijakauma eli suora jakauma Tiettyyn luokkaan Ei kuuluvaa havaintojen lukumäärää kutsutaan frekvenssiksi ja merkitään fi. Jouni Peltonen
48
Jouni Peltonen
49
Esimerkki: Seuraava aineistossa on esitetty erään opiskelijajoukon tilanne opintojen valmistumisen suhteen (0 = keskeytti opinnot, 1 = valmistui ja 2 = muu tilanne): Jouni Peltonen
50
Kysymys: frekvenssitaulu antaa ilman muuta nopeamman yleiskuvan kuin matriisi tai vastaava, mutta samalla menetetään informaatiota. Mitä menetettiin? Jouni Peltonen
51
Esimerkki 4.2. Seuraava aineisto on eräälle kurssille osallistuneiden opiskelijoiden iät.
Luokitus voi olla (1) tasavälinen Jouni Peltonen
52
Luokitus voi olla Tasavälinen
Luokitus voi olla Tasavälinen Add 1. Miten saadaan alkuperäisestä kvantitatiivisesta aineistosta tasavälinen luokitus halutulla luokkien lukumäärällä? (Keinänen 2008) Jouni Peltonen
53
Jouni Peltonen
54
Jouni Peltonen
55
Jouni Peltonen
56
Jouni Peltonen Jouni Peltonen
57
Jouni Peltonen
58
Jouni Peltonen
59
Jouni Peltonen
60
Luokkavälin pituus luokituksessa voidaan laskea
Luokkavälin pituus luokituksessa voidaan laskea (4.1.) ci = luokan Ei todellinen yläraja - luokan Ei todellinen alaraja. Esim. c1 = 20,5 - 16,5 = 4 Luokan Ei todellinen luokkakeskus xi määrätään pyöristetyn ylärajan ja alarajan keskiarvona: Jouni Peltonen
61
(4.2.) xi = ½ ( luokan Ei yläraja + luokan Ei alaraja)
(4.2.) xi = ½ ( luokan Ei yläraja + luokan Ei alaraja) Esim. x1 = ½ ( ) = ½ 37 = 18,5. Jouni Peltonen
62
Taulukko 4.2. Kurssille osallistuneiden opiskelijoiden iän frekvenssijakauma Jouni Peltonen
63
Jouni Peltonen
64
Varoitus: luokitusta voi käyttää tulosten manipulointiin!
Varoitus: luokitusta voi käyttää tulosten manipulointiin! Huomio: luokitus - pyöristys - mittaustarkkuus Jouni Peltonen
65
Luokkien sopiva lukumäärä?
Luokkien sopiva lukumäärä? Jouni Peltonen
66
Luokkien sopiva lukumäärä?
Luokkien sopiva lukumäärä? Jouni Peltonen
67
Suhteellinen frekvenssi fi/n on frekvenssin fi osuus kaikista muuttujan saamista arvoista: Tavallisesti suhteelliset frekvenssit esitetään prosentteina (100 % fi). Jouni Peltonen
68
Jouni Peltonen
69
Jouni Peltonen
70
Jouni Peltonen
71
Jouni Peltonen
72
Jouni Peltonen
73
Jouni Peltonen
74
Jouni Peltonen
75
4.1.2. Yksiulotteisen frekvenssijakauman graafisesta kuvaamisesta
Pylväsdiagrammi Jouni Peltonen
76
Jouni Peltonen
77
ja korkeuksina vastaavat frekvenssit fi.
Histogrammi Histogrammi muodostuu suorakulmioista, joiden kantojen kärkipisteinä ovat todelliset luokkarajat , i = 1, 2, …, l ja korkeuksina vastaavat frekvenssit fi. Jouni Peltonen
78
Jouni Peltonen
79
Add. Histogrammi vs. Pylväsdiagrammi
Add. Histogrammi vs. Pylväsdiagrammi Muuttuja x1 on saatu arpomalla z-jakaumasta arvoja. Jouni Peltonen
80
Pylväsdiagrammi Histogrammi Jouni Peltonen
81
Jouni Peltonen
82
4.1.3. Yhden muuttujan tilastollisesta kuvaamisesta - empiirisen jakauman tunnuslukuja
Jouni Peltonen
83
Jouni Peltonen
84
(B) Mediaani (Md) on keskimmäinen havaintoarvo (tai sitä vastaava ekvivalenssiluokka) järjestetyssä havaintojoukossa, kun havaintojen määrä n on pariton. Jos n on parillinen, mediaani on jompikumpi keskimmäisistä arvoista tai (vähintään välimatka-asteikolla) niiden keskiarvo. Jouni Peltonen
85
Jouni Peltonen
86
(C) Fraktiilit, laatikko-janakuvio: -mediaani on 50 % fraktiili.
-yleisesti p-prosentin fraktiili xp jakaa järjestetyn havaintoaineiston kahteen osaan siten, että korkeintaan fraktiilin xp suuruisia havaintoja on p % kaikista havainnoista 25 % fraktiilia kutsutaan alakvartiiliksi (merkitään Q1) 75 % fraktiili on nimeltään yläkvartiili (merkitään Q3). Jouni Peltonen
87
Jouni Peltonen
88
Jouni Peltonen
89
Desiilit ovat 10 %, 20 %, ..., 90% fraktiileja.
Desiilit ovat 10 %, 20 %, ..., 90% fraktiileja. Jouni Peltonen
90
Jouni Peltonen
91
Jouni Peltonen
92
Jouni Peltonen
93
(C) Aritmeettinen keskiarvo (M, )
, , (C) Aritmeettinen keskiarvo (M, ) Kysymys: mitä aritmeettinen keskiarvo muuttujan jakaumasta kertoo? Jouni Peltonen
94
Jouni Peltonen
95
Leikattu keskiarvo, Winsoroitu keskiarvo ja
( , , Leikattu keskiarvo, Winsoroitu keskiarvo ja muut robustit keskiarvoestimaattorit Esimerkki: Jouni Peltonen
96
Jouni Peltonen
97
Jouni Peltonen
98
Jouni Peltonen
99
Figure 7. Mean and standard deviation of male and female subjects in IQ (RPM) Jouni Peltonen
100
Figure 7. Distributions of male and female subjects in IQ (RPM)
Figure 7. Distributions of male and female subjects in IQ (RPM) Jouni Peltonen
101
Figure 8. Pre-treatment and post-treatment means of IQ Jouni Peltonen
102
Hajontaluvut Miksi hajonnan mittaaminen tieteellisessä tutkimuksessa
Miksi hajonnan mittaaminen tieteellisessä tutkimuksessa on vähintään yhtä tärkeää kuin jakauman sijainnin? Jouni Peltonen
103
Luokitteluasteikolle sopivia hajontalukuja:
entropia ja entropiasuhde, laadullisen vaihtelun indeksi (B) Vähintään järjestysasteikolle sopivia hajonnan mittoja: (C) Vähintään intervalliasteikolle sopivia hajonnan mittoja: Jouni Peltonen
104
Jouni Peltonen
105
Jouni Peltonen
106
Esimerkki: keskipoikkeaman, otosvarianssin ja otoskeskihajonnan laskeminen Jouni Peltonen
107
Jouni Peltonen
108
Jouni Peltonen
109
Jouni Peltonen
110
Jouni Peltonen
111
Momentit, vinous ja huipukkuus
Momentit, vinous ja huipukkuus Muuttujan x k:s momentti origon suhteen eli origomomentti on Muuttujan x k:s keskusmomentti eli momentti keskiarvon suhteen on Jouni Peltonen
112
Kuvio 4.16. Oikealle vino eli positiivisesti vino jakauma
Kuvio Oikealle vino eli positiivisesti vino jakauma Jouni Peltonen
113
Kuvio 4.17. Vasemmalle vino eli negatiivisesti vino jakauma
Kuvio Vasemmalle vino eli negatiivisesti vino jakauma Jouni Peltonen
114
Vinousmittoja: Jouni Peltonen
115
Huipukkuus ja huipukkuusmitat: Platykurtinen Leptokurtinen (normaali-
Platykurtinen (normaali- jakaumaa latteampi/ laakeampi) Leptokurtinen (normaali- jakaumaa huipukkaampi) Mesokurtinen (normaalijakauma) Jouni Peltonen
116
Esimerkki: Tarkastellaan empiirisen muuttujan jakauman vinoutta ja huipukkuutta.
Kuvio Läheisesti normaalijakaumaa noudattavan muuttujan histogrammi Jouni Peltonen
117
Esimerkki: Tarkastellaan empiirisen muuttujan jakauman vinoutta ja huipukkuutta.
Jouni Peltonen
118
4.2. Kaksiulotteisen jakauman (kahden muuttujan) kuvaaminen
Kaksiulotteisen jakauman käsite Jouni Peltonen
119
4.2. Kaksiulotteisen jakauman (kahden muuttujan) kuvaaminen
Kaksiulotteisen jakauman käsite Jouni Peltonen
120
Jouni Peltonen
121
Jouni Peltonen
122
Muuttujaparin (x, y) kaksiulotteisella empiirisellä jakaumalla
Muuttujaparin (x, y) kaksiulotteisella empiirisellä jakaumalla tarkoitetaan taulukkoa Jouni Peltonen
123
Luokitteluasteikollisten muuttujien kaksiulotteinen kuvaaminen
124
Jouni Peltonen
125
Kysymys: mitä keskeistä taulukosta havaitaan
ehdollisia prosentuaalisia osuuksia tarkastelemalla?
126
Jouni Peltonen
127
Jouni Peltonen
128
Jouni Peltonen
129
Jouni Peltonen
130
Luokitteluasteikolliset muuttujat: kontingenssitauluun
perustuvat riippuvuusluvut Jouni Peltonen
131
Jouni Peltonen
132
Tehtävä: laske edellisen esimerkin Khiin neliö –arvon perusteella C:n
Tehtävä: laske edellisen esimerkin Khiin neliö –arvon perusteella C:n arvo esimerkkiaineistossa. Jouni Peltonen
133
Vähintään järjestysasteikolliset muuttujat
Jouni Peltonen
134
Jouni Peltonen
135
Kysymys: Mitä Spearmanin järjestyskorrelaatiokerroin ilmaisee? Mitä kaavassa "tapahtuu"? Jouni Peltonen
136
Vähintään välimatka-asteikolliset muuttujat
Jouni Peltonen
137
Jouni Peltonen
138
Jouni Peltonen
139
Kysymys: Mitä Pearsonin tulomomenttikorrelaatio-
Kysymys: Mitä Pearsonin tulomomenttikorrelaatio- kerroin ilmaisee? Mitä kaavassa "tapahtuu"? Jouni Peltonen
140
Jouni Peltonen
141
Jouni Peltonen
142
Jouni Peltonen
143
Jouni Peltonen
144
Jouni Peltonen
145
Jouni Peltonen
146
Jouni Peltonen
147
Jouni Peltonen
148
Korrelaatiokertoimien tulkinnasta ja käyttämisestä (1) mitta-asteikot;
(1) mitta-asteikot; (2) Jos rxy = 0, on silti mahdollista, että x-y (3) kaksiulotteiset outlier-arvot: Jouni Peltonen
149
Jouni Peltonen
150
Jouni Peltonen
151
Jouni Peltonen
152
(4) Ryhmien yhdistäminen ja erottaminen:
Jouni Peltonen
153
(4) Huomio: tutkimusongelmat voivat olla myös muotoa
(4) Huomio: tutkimusongelmat voivat olla myös muotoa ”Miten x:n ja y:n yhteydet eroavat toisistaan ryhmissä 1, 2, …, k? ”Miten z moderoi x:n ja y:n yhteyttä?” ”Miten z:n tavat moderoida x:n ja y:n yhteyttä eroavat toisistaan ryhmissä 1, 2, …, k?” Jouni Peltonen
154
(4) Ryhmien yhdistäminen ja erottaminen:
(5) Muuttujien mittayksiköt ja niiden vaihtelun määrä vaikuttavat diagrammiin (6) Vain Pearsonin tulomomenttikorrelaatiokerroin on perusjoukon korrelaatiokertoimen estimaattori. (7) Kahden muuttujan välinen korkea korrelaatio ei osoita kausaalisuhdetta. Miksi ei? Jouni Peltonen
191
Esimerkki 5.7. Keskustan pysäkiltä lähtee linja-autoja linnanmaalle 10 minuutin välein. Pysäkille saapuvan matkustajan minuutteina ilmoitettu odotusaika on satunnaismuuttuja, jonka arvona voi olla mikä hyvänsä välillä [0, 10[ oleva reaaliluku. Jos matkustaja ei tunne aikataulua, ovat kaikki odotusajat (ainakin matkustajan subjektiivisesta näkökulmasta) yhtä mahdollisia. Jakaumaa voidaan tällöin kuvata funktiolla, joka saa vakioarvon a välillä [0, 10[. Vakion a arvoa määriteltäessä otetaan lähtökohdaksi mahdollisten odotusaikojen muodostama väli [0, 10[. Tämän ja suoran pi = a väliin jää suorakulmion muotoinen alue, jonka pinta-ala asetetaan vastaamaan varman tapauksen todennäköisyyttä (1). Täten 10 a = 1, josta a = 1/10. Näin saatu funktio f(x) = 1/10, kun 0 x < 10 on kyseisen satunnaismuuttujan tiheysfunktio.
241
Pyöristyksistä:
247
Olkoon koeryhmä 1 ja kontrolliryhmä 2. Jokaiselle näiden
Olkoon koeryhmä 1 ja kontrolliryhmä 2. Jokaiselle näiden ryhmien jäsenelle lasketaan erotuspistemäärä d lopputestin ja alkutestin erotuksena. Testauskelpoiset tilastolliset Hypoteesit voidaan nyt muotoilla esimerkiksi seuraavasti: H0: d1 ≤ d2 H0: d1 > d2
Samankaltaiset esitykset
© 2024 SlidePlayer.fi Inc.
All rights reserved.