YFIA220 Kvantitatiivisten menetelmien syventävä kurssi

Slides:

Advertisements

Samankaltaiset esitykset

Ohjelmiston tekninen suunnittelu

Advertisements

Peruskysymys: onko asteikko luonteeltaan luokitteleva vai jatkuva?

TYTILM1 Tilastolliset menetelmät

Hypoteesin testeistä Testin valinta perustuu aina tutkimusongelmaan ja kuvailuun (joka perustuu mitta-asteikoihin) Testaus ei koskaan ole itsenäinen, vaan.

USKONTO/aineenopettajat AD 4 Ryhmäkokoontuminen Martin Ubani, FT, TM Uskonnon didaktiikan yliopistonlehtori SOKLA.

Vain demonstraatio- käyttöön © Menetelmäopetuksen tietovaranto 1 / 8 Ristiintaulukointi Ristiintaulukointia käytetään tutkittaessa kahden luokittelu- tai.

TUME II / Tilastollinen osuus Tilastollinen riippuvuus

Tutkimus osuuskuntien alueellisesta syntyvyydestä Panu Kalmi / HKKK ja RUN Pellervon Päivä Helsinki.

Tilastollisia menetelmiä

Käyttäytymistieteiden laitos

1. Usean muuttujan funktiot

Luento 3: Varianssianalyysi

Toistorakenne Toistorakennetta käytetään ohjelmissa sellaisissa tilanteissa, joissa jotain tiettyä ohjelmassa tapahtuvaa toimenpidekokonaisuutta halutaan.

Otanta Miksi otantaa? –suuresta perusjoukosta voidaan saada tarvittavat tiedot edullisemmin kuin kokonaistutkimuksella –kiireisyys vaatii usein otantaa.

@ Leena Lahtinen Toistorakenne Ohjelmassa toistetaan tiettyjä toimenpiteitä monta kertaa peräkkäin Toisto noudattaa sille kuuluvia tarkkoja standardoituja.

Muuttujien riippuvuus

S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Esitelmä # - Esitelmöijän nimi Optimointiopin seminaari - Syksy 2010 Lineaarinen.

lineaarinen regressio

5. Lineaarinen optimointi

Korrelaatio Kertoo kahden muuttujan välisestä lineaarisesta yhteydestä eli kuinka hyvin toisen muuttujan avulla voidaan ennustaa toisen muuttujan vaihtelua.

Standardointi tekee eri asteikollisista muuttujista vertailukelpoisia

S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Ohjaamaton oppiminen– Heikki Vesterinen Optimointiopin seminaari - Syksy 2010 Ohjaamaton.

Toistorakenne Toistorakennetta käytetään ohjelmissa sellaisissa tilanteissa, joissa jotain tiettyä ohjelmassa tapahtuvaa toimenpidekokonaisuutta halutaan.

Tilastollinen testaus Mann-Whitneyn –testiä voidaan käyttää hyvin pienille n 2 ≤ 8 keskikokoisille 9 ≤ n 2 ≤ 20 suurille n 2 ≥ 20 otoksille –voidaan käyttää.

Robustius Yleinen idea: jokin pysyy muuttumattomana vaikka jotakin muutetaan.

Monimuuttujamenetelmistä Lähtökohtana mallittaa muuttujien välinen riippuvuusrakenne. Rakenne tulee sovellusalan teoriasta. Sopiva analyysi valitaan mallin.

5. Datan käsittely – lyhyt katsaus Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman.

YFIS200 Kvantitatiivisten menetelmien syventävä kurssi

Toistorakenne Toistorakennetta käytetään ohjelmissa sellaisissa tilanteissa, joissa jotain tiettyä ohjelmassa tapahtuvaa toimenpidekokonaisuutta halutaan.

1 Kvantitatiiviset menetelmät Pienryhmäkokoontumisissa tarvitaan EK03- aineiston haastattelulomake. Sen voi tulostaa verkosta. Linkki löytyy kurssin kotisivulta:

YFIA202 Kvantitatiiviset menetelmät, luento YTT Pertti Jokivuori Syksy luento (Ti )

YFIS220 Kvantitatiivisten menetelmien syventävä kurssi YTT Pertti Jokivuori Kevät luento (Ti )

UNIVERSITY OF TURKU LOGISTINEN REGRESSIOANALYYSI.

1 Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina klo Porthanian salissa PIV Uusintamahdollisuus rästitentissä ma 15– 17.

YTT Pertti Jokivuori Kevät luento (Ti )

YFIA202 Kvantitatiiviset menetelmät, luento YTT Pertti Jokivuori Syksy luento (Ti )

YFIA200 Kvantitatiiviset menetelmät, luento YTT Pertti Jokivuori Syksy luento (Ti )

UNIVERSITY OF TURKU MONIMUUTTUJAMENETELMÄT SOSIAALITYÖN TUTKIMUKSESSA Leena Koivusilta Turun yliopisto, Sosiaalipolitiikan laitos.

Tutkimuksen suunnittelu

YFIS000 Kvantitatiivisten menetelmien syventävä kurssi

Määrällinen tutkimus.

Toistorakenne Toistorakennetta käytetään ohjelmissa sellaisissa tilanteissa, joissa jotain tiettyä ohjelmassa tapahtuvaa toimenpidekokonaisuutta halutaan.

YFIS200 Kvantitatiivisten menetelmien syventävä kurssi

REGRESSIOANALYYSI.

YFIA200 Kvantitatiiviset menetelmät, luento

YFIA202 Kvantitatiiviset menetelmät, luento

YFIS200 Kvantitatiivisten menetelmien syventävä kurssi

YFIS200 Kvantitatiivisten menetelmien syventävä kurssi

VARIANSSIANALYYSI.

Lineaariset regressiomenetelmät

Monimuuttinimuuttuja-analyyseista

YFIS200 Kvantitatiivisten menetelmien syventävä kurssi

YFIA200 Kvantitatiiviset menetelmät, luento

Havaintoaineiston kuvailusta

YFIA202 Kvantitatiiviset menetelmät, luento

YFIA200 Kvantitatiiviset menetelmät, luento

Kritiikin alkulähteillä

YFIA202 Kvantitatiiviset menetelmät, luento

YFIA200 Kvantitatiiviset menetelmät, luento

YFIS200 Kvantitatiivisten menetelmien syventävä kurssi

YFIS200 Kvantitatiivisten menetelmien syventävä kurssi

YFIA200 Kvantitatiiviset menetelmät, luento

YFIA200 Kvantitatiiviset menetelmät, luento

YFIA200 Kvantitatiiviset menetelmät, luento

YFIS200 Kvantitatiivisten menetelmien syventävä kurssi

YFIS200 Kvantitatiivisten menetelmien syventävä kurssi

Riippuvuustarkastelut

Korrelaatio- ja regressioanalyysi

Luento V. Typologia ja tilastotiede

Luento V. Typologia ja tilastotiede

Esityksen transkriptio:

YFIA220 Kvantitatiivisten menetelmien syventävä kurssi YTT Pertti Jokivuori Kevät 2011 2. luento (Ti 25.1.2011)

Ilmiön selittäminen, lineaariset mallit Paul Lazarsfeld puhuu todellisesta yhteydestä tai kausaalisuhteesta, jos muuttujien välinen riippuvuus säilyy suhteessa kaikkiin mahdollisiin kausaalisesti edeltäviin muuttujiin Columbian koulukunnan survey-analyysissa käsiteltiin ja esitettiin seikkaperäisesti niitä ehtoja ja edellytyksiä, jotka tutkijan on osoitettava täytetyksi, ennen kuin hän voi väittää että muuttuja X vaikuttaa muuttujaan Y. Varsinaisia välttämättömiä edellytyksiä Columbian yliopiston koulukunta esitteli kolme: ● X ja Y ovat tilastollisesti riippuvaisia, niiden välillä on yhteys, assosiaatio ● X-muuttujan arvot edeltävät kausaalisesti Y-muuttujan arvoja ● X:n ja Y:n välinen tilastollinen riippuvuus säilyy, vaikka molempia muuttujia kausaalisesti edeltävien muiden muuttujien vaikutus on kontrolloitu

Kausaalisuuden korrelatiivinen rakenne: Kausaalisuuden korrelatiivinen tutkiminen etenee siten, että ensin tutkitaan, onko kahden muuttujan välillä yhteisvaihtelua Jos yhteisvaihtelu havaitaan, selvitetään häviääkö yhteisvaihtelu tai muuttuuko siitä saatava kuva, kun muita muuttujia vakioidaan Tulkitaan havainnon käytännöllinen ja teoreettinen sisältö ja merkitys

Osittaiskorrelaatio: Esimerkki: tutkitaan organisaatio(OC)- ja ammattijärjestösitoutumisen (UC) korrelaatiota, josta työn sosiologiassa käytetään nimitystä kaksoissitoutuminen (dual commitment) Korrelaatiodiagrammiin on piirretty regressiosuora, joka kulkee kaikkien havaintopisteiden keskeltä ja koska regressiosuora (R²=0,052) on nouseva, muuttujien välillä vallitsee positiivinen korrelaatio Korrelaatiotaulukosta nähdään, että Pearsonin tulomomenttikorrelaatiokerroin on 0,23***, eli yhteys muuttujien välillä on varsin selvä ja tilastollisesti erittäin merkitsevä (p=,000)

Osittaiskorrelaatio : Tarkasteltaessa korrelaatiodiagrammia näemme siinä vain kaksi ominaisuutta. Kuitenkin havaintoyksiköillä, jotka on kuviossa sijoitettu X/Y – koordinaatistoon, on tietysti valtava joukko muitakin ominaisuuksia, vaikka emme niitä kahden muuttujan scatter-kuviosta kykene näkemään Kysymys ilmiöiden välisestä kausaalisuudesta tai todellisesta yhteydestä sähköistyy, kun havaitsemme että ikä on voimakkaasti yhteydessä sekä organisaatio- (r=.35***) että ammattijärjestösitoutumiseen (r=.15***) Havainto on ilmiöiden välistä yhteyttä tarkastelevalle tutkijalle olennaisen tärkeä, sillä on täysin mahdollista, että ensin havaittu positiivinen korrelaatio selittyykin iän tuottamaksi näennäisyhteydeksi

Osittaiskorrelaatio : Émile Durkheim (1982, 132−133) kirjoittaa Sosiologian metodisäännöissä seuraavasti: "On vain yksi tapa osoittaa, että ilmiö on toisen syy, nimittäin vertailemalla tapauksia, joissa ne ovat samanaikaisesti läsnä tai poissa, jotta nähtäisiin osoittavatko niiden olosuhteiden eri yhdistelmissä esiintyvät vaihtelut toisen riippuvan toisesta /.../ kahden ilmiön arvojen vastaavuus, olettaen että se esiintyy riittävän useissa ja vaihtelevissa tapauksissa, on todiste niiden keskinäisestä suhteesta."

Osittaiskorrelaatio : Käyttökelpoinen tapa suorittaa vakiointia on käyttää osittaiskorrelaatiota Osittaiskorrelaatio (partial correlation coefficient) on kahden muuttujan välinen korrelaatio, kun yhden tai useamman muuttujan vaikutus on vakioitu Teknisesti osittaiskorrelaatio tarkoittaa sitä, että alkuperäisten muuttujien korrelaatio lasketaan jokaisen vakioitavan, eli testimuuttujan luokissa (syntymävuodet) ja näistä korrelaatiokertoimista lasketaan keskiarvo

Osittaiskorrelaatio : Osittaiskorrelaatiosta ei näy miten alkuperäisten muuttujien yhteys vaihtelee vakioitavan muuttujan, syntymävuoden (z) eri arvoilla, mutta sitä käytetään juuri yhteyden kausaalisuuden tutkimiseen. Ikä on nyt alkuperäisen yhteyden testimuuttuja, jonka jälkeen analyysissä on seuraavat kaksi päätapausta: 1) Alkuperäinen korrelaatio (0.23***) voi heiketä olennaisesti tai hävitä kokonaan, jolloin X:n ja Y:n välinen relaatio oli kolmannen muuttujan (Z, esimerkissä ikä) tuottamaa. Tällöin siis se, että iän myötä lisääntyy sitoutuminen sekä organisaatioon että ammattijärjestöön, tuottaisi havaitun kahden muuttujan yhteyden, joka kuitenkin olisi luonteeltaan näennäinen 2) Alkuperäinen korrelaatio (0.23***) säilyy merkittävänä ja tilastollisesti merkitsevästi nolla-korrelaatiosta eroavana, jolloin muuttujien yhteys ei ole Z:n tuottama näennäisyhteys

Osittaiskorrelaatio : Osittaiskorrelaatiokerroin on sama kuin lineaarisessa regressioanalyysissä saatu standardisoitu regressiokerroin eli beta-kerroin Regressioanalyysin beta-kertoimet havainnollistuvat olennaisesti, kun ymmärrämme selittävän muuttujan ja selitettävän muuttujan välisen yhteyden olevan osittaiskorrelaatio tilanteessa, jossa mallin muut selittävät muuttujat ovat testimuuttujina Jos selittäviä muuttujia on vaikkapa neljä, on x1:n ja selitettävän muuttujan y välinen standardisoitu beta-kerroin osittaiskorrelaatio, kun x2, x3 ja x4 ovat testimuuttujia, joiden sisältämissä luokissa osittaiskorrelaatiokerroin määräytyy

Lineaarinen regressioanalyysi: Regressioanalyysissä pyritään selittämään yhden riippuvan muuttujan vaihtelua muiden, riippumattomien muuttujien, avulla Regressioanalyysiä käyttäessään tutkija uskoo, että jokin ilmiö on seurausta joistakin toisista tekijöistä (muuttujista) Yhteiskuntatieteisiin lineaarinen regressioanalyysi (multiple regression analysis) rantautui vasta 1960-luvulla, vaikka regressioanalyysin tilastotieteelliset perusteet oli luotu jo viime vuosisadan vaihteessa Ensimmäinen esitys lineaarisen regressioanalyysin käytöstä sosiologiassa on Hubert Blalock’in (1961) kirja Causal Inferencies in Nonexperimental Research. Kirjassaan (mt., 51) Blalock esittää, että regressiokertoimet voidaan ymmärtää eräänlaisina ”tieteellisinä säännönmukaisuuksina”

Lineaarinen regressioanalyysi: Regressioanalyysiä voidaan perustellusti pitää yhteiskunta- ja ihmistieteiden parissa monimuuttujamenetelmien kulmakivenä Regressioanalyysin erityinen etu on, että siinä voidaan tutkia yhtä aikaa monen selittävän muuttujan vaikutusta selitettävään muuttujaan Lineaarisessa regressiossa mallinnetaan tilannetta, jossa selitettävä (riippuva) muuttuja Y (dependent variable) riippuu lineaarisesti selittävistä (riippumattomista) muuttujista X1, X2, Xn (independent variables)

Lineaarinen regressioanalyysi: Regressioanalyysin perusolettamukset voidaan tiivistää kolmeen kohtaan: 1) muuttujat ovat kvantitatiivisia, 2) riippuvuudet ovat lineaarisia ja 3) vaikutukset ovat additiivisia Ensimmäinen oletus tarkoittaa, että malliin mukaan otettavat muuttujat ovat vähintään välimatka-asteikollisia (jatkuvia muuttujia, jossa esimerkiksi jonkin ominaisuus lisääntyy muuttujan arvojen kasvaessa tai sitten dummy-muuttuja) Toinen edellytys, riippuvuuksien lineaarisuus, tarkoittaa, että selitettävän ja selittävän tekijän välistä yhteyttä voidaan kuvata suoralla Additiivisuusoletus tarkoittaa sitä, että eri tekijöiden (muuttujien) vaikutukset ovat yhteenlaskettavia, jolloin tämä sisältää myös oletuksen siitä, ettei selittävien muuttujien kesken esiinny korrelaatioita ja ainoat korrelaatiot suuntautuvat selittävistä muuttujista selittävään päin

Lineaarinen regressioanalyysi: Mallin selitysaste = R2 (R Square) on regressiomallin selitysosuus. Se kertoo kuinka suuren osuuden selitettävän muuttujan vaihtelusta regressionanalyysin selittävät muuttujat yhdessä pystyvät selittämään. R2-luku vaihtelee nollan ja yhden välillä Selittävien muuttujien keskinäistä vaikutusvoimakkuutta selittäjänä voidaan lähemmin selvittää Standardized Coeffiecients Beta–sarakkeen tietojen avulla Standardoidut kertoimet kertovat kuinka monta standardihajontayksikköä selitettävä muuttuja muuttuu selitettävän yhden hajonnan kasvun takia

Kaksisuuntainen varianssianalyysi : Perustaltaan varianssianalyysi on tilastollinen menetelmä, jonka avulla tutkitaan poikkeavatko tiettyjen ryhmien keskiarvot toisistaan jonkun kvantitatiivisen, jatkuvan muuttujan suhteen Koska varianssianalyysissa tarkastellaan selitettävien muuttujien ryhmäkeskiarvoja, täytyy selitettävän muuttujan olla sellainen, että siitä on järkevää laskea aritmeettinen keskiarvo, eli käytännössä jatkuva muuttuja Muuttujaa, jonka suhteen ryhmiä vertaillaan, kutsutaan riippuvaksi tai selitettäväksi muuttujaksi Ryhmät ovat selittävän muuttujan luokkia (sukupuolimuuttujassa nainen ja mies, ammattikoulutusmuuttujassa eri ammatillisen koulutuksen tasot) Kaksisuuntaisessa varianssianalyysissa (two-way analysis of variance) selittäviä muuttujia on kaksi. Tällöin voidaan tutkia sitä, vaikuttavatko molemmat selittävät muuttujat selitettävän muuttujan arvoihin yksittäin sekä onko niillä yhteisvaikutusta (eli interaktiovaikutusta)

MCA, moniluokitteluanalyysi: Multiple Classification Analysis, suomeksi moniluokitteluanalyysi yhdistää varianssi- ja regressioanalyysin keskeiset piirteet MCA on tarkoitettu yhden jatkuvan muuttujan vaihtelun tarkasteluun Menetelmän avulla otetaan huomioon usean eri taustamuuttujan samanaikainen vaikutus Tällöin on mahdollista tarkastella, miten selittäjämuuttujien sisältämien ryhmien keskiarvot muuttuvat, kun malliin otetaan mukaan rinnakkaisia taustamuuttujia. Toisten muuttujien vaikutuksen huomioimisella, elaboroinnilla, pyritään vakioimaan niiden vaikutus ja erottamaan todelliset yhteydet näennäisyhteyksistä

MCAn tulokset ilmoitetaan yleensä taulukkomuodossa, josta ilmenee seuraavat tunnusluvut : Taustamuuttujat ja niiden mukaiset havaintomäärät eri osaryhmissä (N) Ryhmäkeskiarvojen poikkeamat kokonaiskeskiarvosta Korjatut ryhmäkeskiarvojen poikkeamat kokonaiskeskiarvosta eli ryhmäkeskiarvojen poikkeamat keskiarvosta, kun muiden selittäjien vaikutus on otettu huomioon Eta-kerroin on analoginen korrelaatiokertoimelle, se kuvaa kunkin taustamuuttujan yhteyttä selitettävään muuttujaan. Etan neliö kertoo kuinka paljon kukin riippumaton muuttuja pystyy yksin selittämään riippuvan muuttujan vaihtelusta Beta-kerroin on analoginen standardoiduille regressiokertoimille, sen avulla voidaan verrata eri muuttujien suhteellista selityskykyä Yhteiskorrelaatiokertoimen (R) neliö kertoo koko mallin selitysasteen (R2). Selitysaste ilmaisee kuinka paljon riippumattomat muuttujat yhdessä selittävät tai kuinka paljon malli selittää riippuvan muuttujan varianssista