Peruskysymys: onko asteikko luonteeltaan luokitteleva vai jatkuva?

Slides:



Advertisements
Samankaltaiset esitykset
TUME II / Tilastollinen osuus
Advertisements

Konfirmatorinen faktorianalyysi
Tilastollista päättelyä
Kartoitustulosten havainnollistaminen Case TaY:n kirjasto
RYHMIEN VERTAILU Jouko Miettunen
KAHDEN RYHMÄN VERTAILU
Luento 2: Tilastollisen tutkimuksen peruskäsitteet ja menetelmät
TUME II / Tilastollinen osuus
TYTILM1 Tilastolliset menetelmät
Hypoteesin testeistä Testin valinta perustuu aina tutkimusongelmaan ja kuvailuun (joka perustuu mitta-asteikoihin) Testaus ei koskaan ole itsenäinen, vaan.
Käyttäytymistieteiden laitos
Kasvatustieteellisen tutkimuksen perusteet
4. Jakaumien teoriaa Jos diskreetin satunnaismuuttujan x
Khiin neliö –riippumattomuustesti 1 Muhos90%10% Oulu86%14% H-pudas80%20% Kyllä Ei Otos:
Vain demonstraatio- käyttöön © Menetelmäopetuksen tietovaranto 1 / 8 Ristiintaulukointi Ristiintaulukointia käytetään tutkittaessa kahden luokittelu- tai.
USEAN RYHMÄN VERTAILU Biostatistiikka
TUME II / Tilastollinen osuus Tilastollinen riippuvuus
Muuttujien muunnokset
Tilastoanalyysien merkitys ekologiassa
Mentelmätarjotin - monimuuttujamenetelmät
Tilastollisia menetelmiä
Kalakantojen arviointi (KALAT22)
Käyttäytymistieteiden laitos
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 11 - Teemu Mutanen Optimointiopin seminaari - Syksy 2005 / 1 Lisätiedon arvo.
Luento 3: Varianssianalyysi
Todennäköisyyslaskenta
Kvantitatiiviset menetelmät
Otanta Miksi otantaa? –suuresta perusjoukosta voidaan saada tarvittavat tiedot edullisemmin kuin kokonaistutkimuksella –kiireisyys vaatii usein otantaa.
Muuttujien riippuvuus
lineaarinen regressio
tilastollisen tutkimuksen vaiheet
Vaihteluväli ja keskipoikkeama
Tilastollinen testaus Χ 2 -testi nelikentässä kaikkein yksinkertaisin lähtökohta tilastolliselle testille Esim. materiaalin (rauta tai pronssi) ja korun.
Korrelaatio Kertoo kahden muuttujan välisestä lineaarisesta yhteydestä eli kuinka hyvin toisen muuttujan avulla voidaan ennustaa toisen muuttujan vaihtelua.
Standardointi tekee eri asteikollisista muuttujista vertailukelpoisia
Piste- ja väliestimointi:
Tilastollinen testaus Mann-Whitneyn –testiä voidaan käyttää hyvin pienille n 2 ≤ 8 keskikokoisille 9 ≤ n 2 ≤ 20 suurille n 2 ≥ 20 otoksille –voidaan käyttää.
TILASTOTIEDE ARKEOLOGIASSA Har 230h
Monimuuttujamenetelmistä Lähtökohtana mallittaa muuttujien välinen riippuvuusrakenne. Rakenne tulee sovellusalan teoriasta. Sopiva analyysi valitaan mallin.
Mihin on tultu?. Tutkimusprosessi (MOTV , muokattu De Vaus 1994, 21 pohjalta): Teoria Hypoteesit Empiiriset mittarit Aineiston kerääminen Aineiston.
Elliptiset jakaumat Kotitehtävän 6 ratkaisu Tuomas Nikoskinen Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta osin kaikki.
5. Datan käsittely – lyhyt katsaus Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman.
1 Kvantitatiiviset menetelmät Pienryhmäkokoontumisissa tarvitaan EK03- aineiston haastattelulomake. Sen voi tulostaa verkosta. Linkki löytyy kurssin kotisivulta:
1 Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina klo Porthanian salissa PIV Uusintamahdollisuus rästitentissä ma 15– 17.
YFIA202 Kvantitatiiviset menetelmät, luento YTT Pertti Jokivuori Syksy luento (Ti )
UNIVERSITY OF TURKU LOGISTINEN REGRESSIOANALYYSI.
1 Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina klo Porthanian salissa PIV Uusintamahdollisuus rästitentissä ma 15– 17.
YFIA202 Kvantitatiiviset menetelmät, luento YTT Pertti Jokivuori Syksy luento (Ti )
UNIVERSITY OF TURKU MONIMUUTTUJAMENETELMÄT SOSIAALITYÖN TUTKIMUKSESSA Leena Koivusilta Turun yliopisto, Sosiaalipolitiikan laitos.
Määrällinen tutkimus.
REGRESSIOANALYYSI.
YFIA220 Kvantitatiivisten menetelmien syventävä kurssi
YFIA200 Kvantitatiiviset menetelmät, luento
YFIA202 Kvantitatiiviset menetelmät, luento
YFIS200 Kvantitatiivisten menetelmien syventävä kurssi
VARIANSSIANALYYSI.
VaR-mallien toimivuuden testaus historian avulla (backtesting)
Havaintoaineiston kuvailusta
YFIA202 Kvantitatiiviset menetelmät, luento
Kritiikin alkulähteillä
YFIA202 Kvantitatiiviset menetelmät, luento
YFIS200 Kvantitatiivisten menetelmien syventävä kurssi
YFIA200 Kvantitatiiviset menetelmät, luento
Parametriset ja Ei-parametriset testit
Tilastolliset tunnusluvut
Riippuvuustarkastelut
Korrelaatio- ja regressioanalyysi
Luento V. Typologia ja tilastotiede
Tilastolliset testit KHI.
Luento V. Typologia ja tilastotiede
Esityksen transkriptio:

Mitta-asteikon vaikutus analyysimenetelmän ja merkitsevyystestin valintaan Peruskysymys: onko asteikko luonteeltaan luokitteleva vai jatkuva? Keskiarvon laskeminen joko on mahdollista (ikä, kuukausitulot, pituus, iloisuus jne.) tai sitten ei (siviilisääty, sukupuoli, erityisopetus/yleisopetus... jne.) Laatueroasteikollisten muuttujien lisäksi luokitteleviksi luetaan järjestysasteikolliset muuttujat, joilla kylläkin on suunta, mutta luokkaväleistä ei vallitse yksimielisyyttä (esim. ammatit) Luokitteleville muuttujille soveltuvat analyysit ja tilastolliset testit pohjautuvat joko ristiintaulukkoon tai non-parametrisiin menetelmiin Jatkuville muuttujille (välimatka-ja suhdeluku-asteikollisille muuttujille, joissa mitattu ominaisuus kasvaa tasaisesti muuttuja-arvojen kasvaessa) ovat luvallisia kutakuinkin kaikki keskiarvoon perustuvat monimuuttujaiset korrelaatio -ja varianssipohjaiset menetelmät

Tilastollisen menetelmän valinta Selitettävä -, riippuva -, y-muuttuja Luokittelu- tai järjestysasteikko Välimatka tai suhdeasteikko Selittävä -, riippumaton -, X –muuttuja Ristiintaulukointi, Loglineaariset mallit T-testi,' Manova, Anova Logistinen ja multinomiaalinen regressioanalyysi Regressioanaly si, polku- ja ra- kenneyhtälömallit

Aineiston parametrisuuden testaaminen Jakauman normaalisuuden testaus: Analyze->explore->plots

Jos sig. arvo on <.05, jakauma poikkeaa tilastollisesti merkitsevästi normaalista Jakauman normaalisuuden testaus = onko muuttuja normaalisti jakautunut. HUOM! Graafinen tarkastelu myös!! Vielä vinoudesta: jos vinousarvot pienempiä kuin-.50 tai suurempia kuin .50 ->kannattaa testata muuttujan normaalisuutta. Jos kovin vino -> valitaan ei-param. menetelmät jotka eivät herkkiä jakauman muodolle (tarkin kriteeri: poikkeama symmetriasta, jos vinousarvo >kuin 2 x keskivirheensä)

Ristiintaulukointi (eli kontingenssitaulukointi) Käyttö: Aineiston kuvaaminen Kahden luokittelevan muuttujanvälisen yhteyden selvittäminen Muuttujien jakaumien vertaaminen eri ryhmissä Soveltuu kategorisille (laatuero- tai järjestysasteikko) muuttujille ja luokitelluille numeerisille (välimatka- tai suhdeasteikko) muuttujille Analyysin tarkoitus: Riippuvuuden tilastollisen merkitsevyyden testaaminen X2–testi (Khiin neliön testi, riippumattomuustesti) Hypoteesit ja niiden testaus: H0= muuttujat ovat riippumattomia H1= muuttujat eivät ole riippumattomia Vapausaste (df) lasketaan taulukon rivien ja sarakkeiden lukumääristä, df=(r-1)(s-1)

Testin havaittu merkitsevyystaso eli p-arvo riippuu testisuureen arvosta ja vapausasteesta P-arvo kertoo erehtymisriskin suuruuden, kun testattava nollahypoteesi hylätään (eli mikä on riski sille, että riippuvuus johtuu sattumasta) Yleensä hylätään nollahypoteesi (eli todetaan, ettei aineisto tue nollahypoteesia), jos erehtymisriski on korkeintaan 5% eli p-arvo < 0,05) Käytön edellytykset: enintään (max.) 20% odotetuista frekvensseistä saa olla pienempiä kuin 5, ja pienin odotettu frekvenssi = 1, eli ei saa olla odotusarvoltaan tyhjiä soluja tai odotetulta frekvenssiltään tyhjiä soluja saa olla siellä täällä, ei kuitenkaan kokonaisia nollarivejä tai -sarakkeita

Ristiintaulukointi SPSS:llä

Korrelaatio (kertausta) Kertoo kahden muuttujan välisestä lineaarisesta yhteydestä eli kuinka hyvin toisen muuttujan avulla voidaan ennustaa toisen muuttujan vaihtelua Ei paljasta käyräviivaista yhteyttä (vrt. ristiintaulukointi) Ei selitä syy-seuraus-suhdetta. Päättely: Korrelaatiokerroin on lineaarisen riippuvuuden voimakkuutta kuvaava tunnusluku (voi saada arvoja, jotka ovat -1:n ja 1:n välillä) Jos kerroin on lähellä arvoa +1, muuttujien välillä on voimakas positiivinen korrelaatio toisen muuttujan arvojen kasvaessa myös toisen muuttujan arvot kasvavat Jos kerroin on lähellä arvoa –1, muuttujien välillä on voimakas negatiivinen korrelaatio  toisen muuttujan arvojen kasvaessa toisen muuttujan arvot pienenevät Jos kerroin on lähellä arvoa 0, ei muuttujien välillä ole lineaarista riippuvuutta

Korrelaatio ei-parametrisillä menetelmillä Spearman - mittaa kahden muuttujan järjestyslukujen yhteyttä - rank correlation, rS Pearson (kertausta) - mittaa kahden satunnaismuuttujan x ja y välisen yhteyden voimakkuutta - satunnaismuuttujien oltava vähintään intervalli-asteikolliset ja normaalijakautuneet HUOM: Selitysaste saadaan korottamalla korrelaatiokerroin (.57) potenssiin 2. R2 eli korrelaatiokertoimen neliö (jos r2= 0.32), niin selittävämuuttuja selittää32% selitettävän muuttujan varianssista

T-testi Kun vertaillaan kahta täysin toisistaan riippumatonta osajoukkoa toisiinsa ja halutaan tietää eroavatko ryhmien keskiarvot toisistaan, voidaan tilastollisena menetelmänä käyttää riippumattomien (independent) otosten t -testiä. Testin oletuksia ovat muuttujan normaalijakautuneisuus ja riippumattomat otokset. raportoidaan Testisuureen valintaan vaikuttaa ovatko varianssit (keskihajonnat) molemmissa osajoukoissa yhtäsuuret.

Parametriset ja Ei-parametriset testit Tilastolliset testit voidaan jakaa parametrisiin ja ei-parametrisiin testeihin sen mukaan, minkälaisia jakaumia testit käyttävät. Parametrisilla testeillä on jakaumaoletuksia. - vähintään välimatka-asteikko - varianssien yhtäsuuruus - jakaumien normaaliuus Ei-parametrisillä testeillä ei ole jakaumaoletuksia. - testit eivät kuitenkaan yhtä voimakkaita kuin parametriset testit, jonka vuoksi kannattaa käyttää parametrisiä aina kuin siihen on mahdollisuus Parametrinen Ei-parametrinen Ristiintaulukointi (X2=1.24, df=2, p=.54). Pearsonin tulomomenttikorrelaatio vs. Spearmanin järjestyskorrelaatio (r=.86, p<.01) Riippumattomien otosten t-testi vs. Mann-Whitney U-testi (t=6.61, df=28, p<.01) (U=4.00, p<.01) Yksisuuntainen varianssi analyysi vs. Kruskall-Wallis –testi (F2,27=29.83, p<.01) (X2=25,91, df=2, p<.01) Toistomittaus vs. Wilcoxonin testi (t=-11.86, df=28, p<.01) (Z=-4.70, p<.01)