Esittely latautuu. Ole hyvä ja odota

Esittely latautuu. Ole hyvä ja odota

YFIA220 Kvantitatiivisten menetelmien syventävä kurssi

Samankaltaiset esitykset


Esitys aiheesta: "YFIA220 Kvantitatiivisten menetelmien syventävä kurssi"— Esityksen transkriptio:

1 YFIA220 Kvantitatiivisten menetelmien syventävä kurssi
YTT Pertti Jokivuori Kevät 2011 2. luento (Ti )

2 Ilmiön selittäminen, lineaariset mallit
Paul Lazarsfeld puhuu todellisesta yhteydestä tai kausaalisuhteesta, jos muuttujien välinen riippuvuus säilyy suhteessa kaikkiin mahdollisiin kausaalisesti edeltäviin muuttujiin Columbian koulukunnan survey-analyysissa käsiteltiin ja esitettiin seikkaperäisesti niitä ehtoja ja edellytyksiä, jotka tutkijan on osoitettava täytetyksi, ennen kuin hän voi väittää että muuttuja X vaikuttaa muuttujaan Y. Varsinaisia välttämättömiä edellytyksiä Columbian yliopiston koulukunta esitteli kolme: ● X ja Y ovat tilastollisesti riippuvaisia, niiden välillä on yhteys, assosiaatio ● X-muuttujan arvot edeltävät kausaalisesti Y-muuttujan arvoja ● X:n ja Y:n välinen tilastollinen riippuvuus säilyy, vaikka molempia muuttujia kausaalisesti edeltävien muiden muuttujien vaikutus on kontrolloitu

3 Kausaalisuuden korrelatiivinen rakenne:
Kausaalisuuden korrelatiivinen tutkiminen etenee siten, että ensin tutkitaan, onko kahden muuttujan välillä yhteisvaihtelua Jos yhteisvaihtelu havaitaan, selvitetään häviääkö yhteisvaihtelu tai muuttuuko siitä saatava kuva, kun muita muuttujia vakioidaan Tulkitaan havainnon käytännöllinen ja teoreettinen sisältö ja merkitys

4 Osittaiskorrelaatio:
Esimerkki: tutkitaan organisaatio(OC)- ja ammattijärjestösitoutumisen (UC) korrelaatiota, josta työn sosiologiassa käytetään nimitystä kaksoissitoutuminen (dual commitment) Korrelaatiodiagrammiin on piirretty regressiosuora, joka kulkee kaikkien havaintopisteiden keskeltä ja koska regressiosuora (R²=0,052) on nouseva, muuttujien välillä vallitsee positiivinen korrelaatio Korrelaatiotaulukosta nähdään, että Pearsonin tulomomenttikorrelaatiokerroin on 0,23***, eli yhteys muuttujien välillä on varsin selvä ja tilastollisesti erittäin merkitsevä (p=,000)

5 Osittaiskorrelaatio :
Tarkasteltaessa korrelaatiodiagrammia näemme siinä vain kaksi ominaisuutta. Kuitenkin havaintoyksiköillä, jotka on kuviossa sijoitettu X/Y – koordinaatistoon, on tietysti valtava joukko muitakin ominaisuuksia, vaikka emme niitä kahden muuttujan scatter-kuviosta kykene näkemään Kysymys ilmiöiden välisestä kausaalisuudesta tai todellisesta yhteydestä sähköistyy, kun havaitsemme että ikä on voimakkaasti yhteydessä sekä organisaatio- (r=.35***) että ammattijärjestösitoutumiseen (r=.15***) Havainto on ilmiöiden välistä yhteyttä tarkastelevalle tutkijalle olennaisen tärkeä, sillä on täysin mahdollista, että ensin havaittu positiivinen korrelaatio selittyykin iän tuottamaksi näennäisyhteydeksi

6 Osittaiskorrelaatio :
Émile Durkheim (1982, 132−133) kirjoittaa Sosiologian metodisäännöissä seuraavasti: "On vain yksi tapa osoittaa, että ilmiö on toisen syy, nimittäin vertailemalla tapauksia, joissa ne ovat samanaikaisesti läsnä tai poissa, jotta nähtäisiin osoittavatko niiden olosuhteiden eri yhdistelmissä esiintyvät vaihtelut toisen riippuvan toisesta /.../ kahden ilmiön arvojen vastaavuus, olettaen että se esiintyy riittävän useissa ja vaihtelevissa tapauksissa, on todiste niiden keskinäisestä suhteesta."

7 Osittaiskorrelaatio :
Käyttökelpoinen tapa suorittaa vakiointia on käyttää osittaiskorrelaatiota Osittaiskorrelaatio (partial correlation coefficient) on kahden muuttujan välinen korrelaatio, kun yhden tai useamman muuttujan vaikutus on vakioitu Teknisesti osittaiskorrelaatio tarkoittaa sitä, että alkuperäisten muuttujien korrelaatio lasketaan jokaisen vakioitavan, eli testimuuttujan luokissa (syntymävuodet) ja näistä korrelaatiokertoimista lasketaan keskiarvo

8 Osittaiskorrelaatio :
Osittaiskorrelaatiosta ei näy miten alkuperäisten muuttujien yhteys vaihtelee vakioitavan muuttujan, syntymävuoden (z) eri arvoilla, mutta sitä käytetään juuri yhteyden kausaalisuuden tutkimiseen. Ikä on nyt alkuperäisen yhteyden testimuuttuja, jonka jälkeen analyysissä on seuraavat kaksi päätapausta: 1) Alkuperäinen korrelaatio (0.23***) voi heiketä olennaisesti tai hävitä kokonaan, jolloin X:n ja Y:n välinen relaatio oli kolmannen muuttujan (Z, esimerkissä ikä) tuottamaa. Tällöin siis se, että iän myötä lisääntyy sitoutuminen sekä organisaatioon että ammattijärjestöön, tuottaisi havaitun kahden muuttujan yhteyden, joka kuitenkin olisi luonteeltaan näennäinen 2) Alkuperäinen korrelaatio (0.23***) säilyy merkittävänä ja tilastollisesti merkitsevästi nolla-korrelaatiosta eroavana, jolloin muuttujien yhteys ei ole Z:n tuottama näennäisyhteys

9 Osittaiskorrelaatio :
Osittaiskorrelaatiokerroin on sama kuin lineaarisessa regressioanalyysissä saatu standardisoitu regressiokerroin eli beta-kerroin Regressioanalyysin beta-kertoimet havainnollistuvat olennaisesti, kun ymmärrämme selittävän muuttujan ja selitettävän muuttujan välisen yhteyden olevan osittaiskorrelaatio tilanteessa, jossa mallin muut selittävät muuttujat ovat testimuuttujina Jos selittäviä muuttujia on vaikkapa neljä, on x1:n ja selitettävän muuttujan y välinen standardisoitu beta-kerroin osittaiskorrelaatio, kun x2, x3 ja x4 ovat testimuuttujia, joiden sisältämissä luokissa osittaiskorrelaatiokerroin määräytyy

10 Lineaarinen regressioanalyysi:
Regressioanalyysissä pyritään selittämään yhden riippuvan muuttujan vaihtelua muiden, riippumattomien muuttujien, avulla Regressioanalyysiä käyttäessään tutkija uskoo, että jokin ilmiö on seurausta joistakin toisista tekijöistä (muuttujista) Yhteiskuntatieteisiin lineaarinen regressioanalyysi (multiple regression analysis) rantautui vasta 1960-luvulla, vaikka regressioanalyysin tilastotieteelliset perusteet oli luotu jo viime vuosisadan vaihteessa Ensimmäinen esitys lineaarisen regressioanalyysin käytöstä sosiologiassa on Hubert Blalock’in (1961) kirja Causal Inferencies in Nonexperimental Research. Kirjassaan (mt., 51) Blalock esittää, että regressiokertoimet voidaan ymmärtää eräänlaisina ”tieteellisinä säännönmukaisuuksina”

11 Lineaarinen regressioanalyysi:
Regressioanalyysiä voidaan perustellusti pitää yhteiskunta- ja ihmistieteiden parissa monimuuttujamenetelmien kulmakivenä Regressioanalyysin erityinen etu on, että siinä voidaan tutkia yhtä aikaa monen selittävän muuttujan vaikutusta selitettävään muuttujaan Lineaarisessa regressiossa mallinnetaan tilannetta, jossa selitettävä (riippuva) muuttuja Y (dependent variable) riippuu lineaarisesti selittävistä (riippumattomista) muuttujista X1, X2, Xn (independent variables)

12 Lineaarinen regressioanalyysi:
Regressioanalyysin perusolettamukset voidaan tiivistää kolmeen kohtaan: 1) muuttujat ovat kvantitatiivisia, 2) riippuvuudet ovat lineaarisia ja 3) vaikutukset ovat additiivisia Ensimmäinen oletus tarkoittaa, että malliin mukaan otettavat muuttujat ovat vähintään välimatka-asteikollisia (jatkuvia muuttujia, jossa esimerkiksi jonkin ominaisuus lisääntyy muuttujan arvojen kasvaessa tai sitten dummy-muuttuja) Toinen edellytys, riippuvuuksien lineaarisuus, tarkoittaa, että selitettävän ja selittävän tekijän välistä yhteyttä voidaan kuvata suoralla Additiivisuusoletus tarkoittaa sitä, että eri tekijöiden (muuttujien) vaikutukset ovat yhteenlaskettavia, jolloin tämä sisältää myös oletuksen siitä, ettei selittävien muuttujien kesken esiinny korrelaatioita ja ainoat korrelaatiot suuntautuvat selittävistä muuttujista selittävään päin

13 Lineaarinen regressioanalyysi:
Mallin selitysaste = R2 (R Square) on regressiomallin selitysosuus. Se kertoo kuinka suuren osuuden selitettävän muuttujan vaihtelusta regressionanalyysin selittävät muuttujat yhdessä pystyvät selittämään. R2-luku vaihtelee nollan ja yhden välillä Selittävien muuttujien keskinäistä vaikutusvoimakkuutta selittäjänä voidaan lähemmin selvittää Standardized Coeffiecients Beta–sarakkeen tietojen avulla Standardoidut kertoimet kertovat kuinka monta standardihajontayksikköä selitettävä muuttuja muuttuu selitettävän yhden hajonnan kasvun takia

14 Kaksisuuntainen varianssianalyysi :
Perustaltaan varianssianalyysi on tilastollinen menetelmä, jonka avulla tutkitaan poikkeavatko tiettyjen ryhmien keskiarvot toisistaan jonkun kvantitatiivisen, jatkuvan muuttujan suhteen Koska varianssianalyysissa tarkastellaan selitettävien muuttujien ryhmäkeskiarvoja, täytyy selitettävän muuttujan olla sellainen, että siitä on järkevää laskea aritmeettinen keskiarvo, eli käytännössä jatkuva muuttuja Muuttujaa, jonka suhteen ryhmiä vertaillaan, kutsutaan riippuvaksi tai selitettäväksi muuttujaksi Ryhmät ovat selittävän muuttujan luokkia (sukupuolimuuttujassa nainen ja mies, ammattikoulutusmuuttujassa eri ammatillisen koulutuksen tasot) Kaksisuuntaisessa varianssianalyysissa (two-way analysis of variance) selittäviä muuttujia on kaksi. Tällöin voidaan tutkia sitä, vaikuttavatko molemmat selittävät muuttujat selitettävän muuttujan arvoihin yksittäin sekä onko niillä yhteisvaikutusta (eli interaktiovaikutusta)

15 MCA, moniluokitteluanalyysi:
Multiple Classification Analysis, suomeksi moniluokitteluanalyysi yhdistää varianssi- ja regressioanalyysin keskeiset piirteet MCA on tarkoitettu yhden jatkuvan muuttujan vaihtelun tarkasteluun Menetelmän avulla otetaan huomioon usean eri taustamuuttujan samanaikainen vaikutus Tällöin on mahdollista tarkastella, miten selittäjämuuttujien sisältämien ryhmien keskiarvot muuttuvat, kun malliin otetaan mukaan rinnakkaisia taustamuuttujia. Toisten muuttujien vaikutuksen huomioimisella, elaboroinnilla, pyritään vakioimaan niiden vaikutus ja erottamaan todelliset yhteydet näennäisyhteyksistä

16 MCAn tulokset ilmoitetaan yleensä taulukkomuodossa, josta ilmenee seuraavat tunnusluvut :
Taustamuuttujat ja niiden mukaiset havaintomäärät eri osaryhmissä (N) Ryhmäkeskiarvojen poikkeamat kokonaiskeskiarvosta Korjatut ryhmäkeskiarvojen poikkeamat kokonaiskeskiarvosta eli ryhmäkeskiarvojen poikkeamat keskiarvosta, kun muiden selittäjien vaikutus on otettu huomioon Eta-kerroin on analoginen korrelaatiokertoimelle, se kuvaa kunkin taustamuuttujan yhteyttä selitettävään muuttujaan. Etan neliö kertoo kuinka paljon kukin riippumaton muuttuja pystyy yksin selittämään riippuvan muuttujan vaihtelusta Beta-kerroin on analoginen standardoiduille regressiokertoimille, sen avulla voidaan verrata eri muuttujien suhteellista selityskykyä Yhteiskorrelaatiokertoimen (R) neliö kertoo koko mallin selitysasteen (R2). Selitysaste ilmaisee kuinka paljon riippumattomat muuttujat yhdessä selittävät tai kuinka paljon malli selittää riippuvan muuttujan varianssista


Lataa ppt "YFIA220 Kvantitatiivisten menetelmien syventävä kurssi"

Samankaltaiset esitykset


Iklan oleh Google