Esittely latautuu. Ole hyvä ja odota

Esittely latautuu. Ole hyvä ja odota

Kvantitatiiviset tutkimusmenetelmät

Samankaltaiset esitykset


Esitys aiheesta: "Kvantitatiiviset tutkimusmenetelmät"— Esityksen transkriptio:

1

2 Kvantitatiiviset tutkimusmenetelmät
Luento 4 Faktorianalyysi Kaisu Puumalainen

3 Yleistä

4 Tavoite Tiivistää tietoa vähentämällä muuttujien lukumäärää
Löytää muuttujajoukosta piileviä rakenteita – faktori on abstrakti piilevä dimensio, jota yksittäiset muuttujat ilmentävät, vrt. Reflektiivinen mittareiden muodostaminen Keskeinen analyysimenetelmä yhdistettyjen mittareiden muodostamisessa ja validiteettitarkastelussa Auttaa hahmottamaan mitkä muuttujat voisi yhdistää samaan summamuuttujaan Ryhmitellään muuttujia (tai havaintoja, Q-tyyppi) Tyyppejä: Pääkomponenttianalyysi Eksploratiivinen faktorianalyysi Konfirmatorinen faktorianalyysi

5 Perusidea Hyödynnetään muuttujien välistä korrelaatiota yhdistämällä keskenään vahvasti korreloivat muuttujat yhdeksi faktoriksi Interdependence, korrelaatiota mutta ei kausaliteettia Esim. Yrityksen liikevaihto ja yrityksen henkilöstömäärä korreloivat voimakkaasti positiivisesti, niiden välinen regressiosuora vetää yhteen sen tiedon joka kummastakin saadaan – molemmat kuvaavat yrityksen toiminnan mittakaavaa

6 Viiden muuttujan esimerkki, korrelaatiomatriisi
1 2 3 4 5 .75 .80 .85 .10 .05 .00 .60

7 Viiden muuttujan esimerkki, korrelaatiot pallojen leikkauspintoina
1 4 5 3 yhteinen varianssi, faktori 1 2 yhteinen varianssi, faktori 2

8 Vaiheet

9 Vaiheet Muuttujien valinta Edellytysten tarkistus Faktorointimenetelmän valinta Faktoreiden määrän valinta Rotaatio Tulkinta Validointi Jatkoanalyysit

10 Muuttujien valinta Muuttujien oltava jatkuvia, mieluiten intervalli- tai suhdeasteikollisia. Likert ok Ei syy- seuraussuhteessa olevia muuttujia samaan faktorianalyysiin Havaintoja on oltava enemmän kuin muuttujia, suositus havaintoa/muuttuja, min 50 havaintoa, yleensä yli 100 Lähtee korrelaatiomatriisista, joten tulisi olla suhteellisen normaalijakautuneita (ei outlier-havaintoja)

11 Edellytysten tarkistus
Merkitseviä korrelaatioita pitää olla (miel. runsaasti yli .3, suunnalla ei väliä) jos faktorimalli on hyvä niin muuttujaparin väliset osittaiskorrelaatiot (kun muiden muuttujien vaikutus on eliminoitu) ovat pieniä Measure of sampling adequacy (MSA) lasketaan osittaiskorrelaatioista, ja sen tulisi olla jokaisella muuttujalla vähintään 0.5 Jos muuttujan MSA on huono, se voi johtua siitä että muuttuja korreloi vain yhden toisen muuttujan kanssa (kahden muuttujan faktori)

12 Edellytysten tarkistus
Kaiser’s Measure of Sampling Adequacy Overall –tunnusluku on MSA muuttujille kokonaisuutena, ja se kuvaa korrelaatiomatriisin soveltuvuutta faktorianalyysiin MSA-arvo on sitä pienempi mitä suurempia osittaiskorrelaatiot ovat Kaiserin ohjearvot 0.9 marvelous 0.8 meritorious 0.7 middling 0.6 mediocre 0.5 miserable alle 0.5 unacceptable

13 Osittaiskorrelaatio Partial correlation
kahden muuttujan välinen korrelaatio, kun yhden tai useamman muuttujan vaikutus on poistettu (vakioitu) Esim. jäätelon kulutus ja hukkumiskuolemien määrä korreloivat voimakkaasti. Korrelaatio johtuu siitä, että molemmat korreloivat lämpötilan kanssa. mielekäs korrelaatio saadaan laskemalla osittaiskorrelaatio jäätelön kulutuksen ja hukkumiskuolemien määrän välillä, kun lämpötilan vaikutus on poistettu. Myös osittaiskorrelaatio kuvaa muuttujien lineaarista yhteyttä, joka vaihtelee välillä Osittaiskorrelaatio voidaan yleistää useamman muuttujan samanaikaiseen vakiointiin

14 Osittaiskorrelaatio osittaiskorrelaatio x:n ja y:n välillä, kun z:n vaikutus on vakioitu osittaiskorrelaatio x:n ja y:n välillä, kun z:n ja w:n vaikutukset on vakioitu

15 Osittaiskorrelaatio, esim.
x = yrityksen R&D-menot, k€ y = yrityksen nettotulos, k€ korrelaatio rxy= .70 Vau! Innovaatiopanostukset selittävät 49% yrityksen tuloksellisuudesta? z = yrityksen liikevaihto korrelaatiot rxz = .80 ja ryz = .75 osittaiskorrelaatio rxy.z = .25 Kun yrityskoon vaikutus otetaan huomioon, niin selittääkin 6.25% tuloksellisuudesta

16 Faktorointimenetelmän valinta
Muuttujien kokonaisvaihtelu (total variance) jaetaan faktoreihin Pääkomponentti (principal component) Muuttujien yhteinen vaihtelu jaetaan faktoreihin + virhevaihtelu (common variance + unique, ”error” variance) Pääakseli (principal axis / principal factor) Maximum likelihood Alpha factoring

17 Pääkomponentit (principal components)
Haetaan muuttujien lineaarikombinaatioita, tavoitteena tiedon tiivistäminen F1= a*x1+ b*x2 +….. F2= c*x1+ d*x2 +….. Faktoreita aluksi yhtä monta kuin muuttujia Ensimmäinen faktori selittää eniten muuttujien vaihtelusta, toinen toiseksi eniten jne. Kannattaa ottaa lopulta mukaan vain sellaiset faktorit jotka selittävät vaihtelusta enemmän kuin yksi yksittäinen muuttuja

18 Pääakselianalyysi (common factor analysis)
Tiedetään että on olemassa tietty piilevä käsite tai ominaisuus Piilevä ominaisuus on syynä siihen miksi yksittäiset muuttujat saavat tiettyjä arvoja Yksittäisen muuttujan vaihtelu jakautuu kahteen osaan: Yhteinen (common), joka johtuu piilevien ominaisuuksien saamista arvoista Yksittäinen (unique, error), joka ei riipu mistään piilevästä ominaisuudesta Muuttujat ovat lineaarikombinaatioita faktoreista + yksittäinen virhevarianssi x1= a*F1+ b*F2 +….. +u1 x2= c*F1+ d*F2 +….. +u2

19 Montako faktoria? tarpeeksi vähän jotta tieto tiivistyy, mutta tarpeeksi paljon jotta alkuperäisestä tiedosta ei häviä liikaa teorian perusteella, esim. replikaatiot selitysosuus varianssista (percentage of variance explained, esim. 60%) ominaisarvo (eigenvalue, latent root criterion) ykköstä suurempi (paras kun muuttujaa) faktoreiden tulkinta on mielekäs scree test, scree plotista poikki kun viiva tasaantuu

20 Rotaatio ortogonaaliset (Varimax, Quartimax, Equimax) tuottavat keskenään korreloimattomia faktoreita vinorotaatiot (oblique) tuottavat korreloivia (pattern matrix) Factor 2 Factor 1

21 Tulkinta: lataukset loadings
korrelaatio yksittäisen muuttujan ja faktorin välillä vaihteluväli -1…+1 latauksen neliö kertoo montako prosenttia faktori selittää muuttujan vaihtelusta olisi hyvä että jokainen muuttuja saisi itseisarvoltaan suuren latauksen yhdellä ja vain yhdellä faktorilla, mieluiten >.5 rotaatio helpottaa tulkintaa

22 Tulkinta: lataukset katso ensin millä faktorilla kukin muuttuja saa suurimman latauksen, SAS osaa järjestää muuttujat niin että tämä on helppoa jos muuttuja ei saa merkittävän suurta latausta millään faktorilla niin poista se jos muuttuja saa isohkon samansuuruisen latauksen kahdella faktorilla niin kannattaa harkita poistamista katso faktoreittain mitä yhteistä voisi olla siihen latautuvilla muuttujilla, se on faktorin nimi eli piilevä ominaisuus

23 Tulkinta: latauksen merkitsevyys
käytännöllinen: min .3, mielellään .5 tilastollinen: (lataus ja merkitsevyyteen tarvittava otoskoko) .60 85 .70 60

24 Tulkinta: kommunaliteetti
communalities yksittäisen muuttujan tunnusluku, se osuus varianssista jonka faktorit selittävät latausten neliöiden summa vaihteluväli 0…1 tulisi olla mahdollisimman suuri (yli .50) jos on pieni niin muuttujalla on vähän yhteistä muiden muuttujien kanssa, ja se kannattaa jättää pois tarkastelusta tai tutkia erikseen

25 Validointi jotta voisi yleistää on arvioitava ratkaisun stabiilisuutta
puolita aineisto satunnaisesti ja tee sama faktorianalyysi molemmille puoliskoille, samanlaisuutta voi myös analysoida tilastollisesti Kokeile erilaisia faktorointi- tai rotaatiomenetelmiä tarkista ettei ole outlier-havaintoja esim. scatterplotin avulla käyttäytyvätkö faktoripistemäärät teorian mukaisesti

26 Jatkoanalyysit faktoripistemäärät, kärkimuuttujat, summamuuttujat
voit käyttää faktoripistemääriä kuten mitä tahansa jatkuvaa normaalijakautunutta muuttujaa, esim. keskiarvotestit, korrelaatio, regressioanalyysi muista että kaikkien faktoreiden keskiarvo on nolla, eli suoraan pistemääristä ei voi arvioida eri faktoreiden suhteellista merkitystä Jos haluat säilyttää alkuperäisten muuttujien skaalan, käytä faktoripistemäärien asemesta muuttujien keskiarvona laskettua summamuuttujaa

27 SAS ohjelmisto

28 SAS Analyze – Multivariate – Factor analysis

29 SAS – factoring method Faktorointimenetelmän valinta
Faktoreiden määrä, aluksi smallest eigenvalue 1, myöhemmin voit asettaa itse lukumäärän

30 SAS- factoring method Method: pääkomponetti (principal component), pääakseli (principal factor) ja maximum likelihood yleisimmin käytettyjä Number of factors: yleensä aluksi faktorit joilla ominaisarvo on suurempi kuin yksi (selittää enemmän kuin yksittäinen muuttuja keskimäärin), voit määrätä myös tietyn lukumäärän faktoreita, tai minimin selitysosuudelle varianssista

31 SAS - communality

32 SAS- communality Pääkomponenttianalyysissa alustavat kommunaliteetit ovat aina ykkösiä Jos haluat käyttää pääakselimenetelmää sinun tulee edellä valita principal component ja tässä kohtaa valita kommunaliteetiksi joku muu vaihtoehto kuin ykköset, yleensä multippelikorrelaatiokertoimien perusteella (paljonko muut muuttujat selittävät kunkin muuttujan vaihtelusta)

33 SAS – rotation and plots

34 SAS- rotation and plots
Ortogonaaliset ja vinorotaatiot (oblique) ortogonaalinen tuottaa keskenään korreloimattomia faktoreita, isot lataukset suurenevat ja pienet pienenevät, esim. Orthogonal varimax vinorotaatio tuottaa keskenään korreloivia faktoreita Plot factor pattern piirtää kuvion latauksista scree plot: kunkin faktorin ominaisarvojen pieneneminen graafisesti

35 SAS - results Muista tähän oma kirjastosi
Tämä tulkinnan helpottamiseksi Nämä edellytysten tarkistamiseksi

36 SAS-results save output data- factors: tallentaa faktoripistemäärät uusiksi muuttujiksi uusien muuttujien keskiarvoksi tulee nolla, ja varianssiksi yksi (ovat standardoituja muuttujia) Reorder matrix rows by highest absolute loading kannattaa valita tulkinnan helpottamiseksi, tällöin samalle faktorille latautuvat muuttujat ovat allekkain listassa Related statistics antaa perustunnusluvut ja korrelaatiot muuttujille sekä MSA-luvut edellytysten arvioimiseksi

37 Means and Standard Deviations from 280 Observations
SAS-tulostus Means and Standard Deviations from 280 Observations Variable Mean Std Dev igo1 igo2 igo3 igo4 igo5 igo6 igo7 igo8 igo9 igo10 igo11 Tarkista että kaikissa muuttujissa on tarpeeksi hajontaa, 1-5 asteikolla ”hyvä” keskiarvo 2,5 – 3,5 ja keskihajonta noin 1

38 SAS-tulostus korrelaatiomatriisin alku
Correlations igo1 igo2 igo3 igo4 Strong growth is necessary to ensure our future positions Our company is of optimum size as it is We seek steady growth Growth can be achieved mainly through internationalization igo5 There is still enough growth potential in domestic markets igo6 Risks related to internationalization are too high igo7 We need to internationalize in order to succeed in the future igo8 We need partners in order to internationalize igo9 We have enough resources to internationalize

39 SAS-tulostus korrelaatiomatriisin loppu
Correlations igo8 igo9 igo10 igo11 igo5 There is still enough growth potential in domestic markets igo6 Risks related to internationalization are too high igo7 We need to internationalize in order to succeed in the future We need partners in order to internationalize We have enough resources to internationalize It is important for our company to internationalize quickly Internationalization is the only means to achieve the objectives of growth we have set Löytyykö muuttujia jotka eivät korreloi merkitsevästi minkään kanssa

40 SAS-tulostus: osittaiskorrelaatiot
Partial Correlations Controlling all other Variables igo1 igo2 igo3 igo4 igo5 Strong growth is necessary to ensure our future positions Our company is of optimum size as it is We seek steady growth Growth can be achieved mainly through internationalization There is still enough growth potential in domestic markets igo6 Risks related to internationalization are too high igo7 We need to internationalize in order to succeed in the future igo8 We need partners in order to Internationalize Näiden olisi hyvä olla pieniä

41 SAS-tulostus: edellytysten tarkistus
Kaiser's Measure of Sampling Adequacy: Overall MSA = igo1 igo2 igo3 igo4 igo5 igo6 igo7 Kaiser's Measure of Sampling Adequacy: Overall MSA = igo8 igo9 igo10 igo11 Igo8 ja igo1 huonoja, muut ok > .60

42 SAS-tulostus: faktoreiden määrä ja selitysosuus
Eigenvalues of the Correlation Matrix: Total = 11 Average = 1 Eigenvalue Difference Proportion Cumulative 1 0.3748 2 0.1468 0.5217 3 0.1220 0.6437 4 0.0751 0.7188 5 0.0703 0.7891 6 0.0534 0.8425 7 0.0478 0.8903 8 0.0385 0.9288 9 0.0285 0.9573 10 0.0230 0.9803 11 0.0197 1.0000 3 faktoria, joilla ominaisarvo >1. Ne selittävät yhteensä 64% muuttujien vaihtelusta

43 Tulostus: faktoreiden määrä ja selitysosuus

44 SAS-tulostus: muuttujien latautuminen faktoreille
Factor Pattern Factor1 Factor2 Factor3 igo11 Internationalization only means to achieve the objectives of growth igo7 We need to internationalize in order to succeed in the future igo4 Growth can be achieved mainly through internationalization igo10 It is important for our company to internationalize quickly igo6 Risks related to internationalization are too high igo5 There is still enough growth potential in domestic markets igo2 Our company is of optimum size as it is igo3 We seek steady growth igo1 Strong growth is necessary to ensure our future positions igo8 We need partners in order to internationalize igo9 We have enough resources to internationalize Rotatoimattomat lataukset, älä tulkitse vielä näitä

45 SAS-tulostus: faktoreiden selitysosuudet
Variance Explained by Each Factor Factor1 Factor2 Factor3 Sama kuin ominaisarvot, jotka näkyivät jo aiemmassa taulukossa

46 SAS-tulostus: muuttujien kommunaliteetit
Final Communality Estimates: Total = igo1 igo2 igo3 igo4 igo5 igo6 igo7 igo8 igo9 igo10 igo11 Lopulliset kommunaliteetit kertovat kuinka suuren osan kunkin muuttujan vaihtelusta 3 faktoria selittävät, igo2 ja igo3 hieman muita huonompia, yli 0.5 ok

47 SAS-tulostus: muunnosmatriisi
Orthogonal Transformation Matrix 1 2 3 Latausmatriisi kerrotaan tällä matriisilla, jotta saadaan rotatoitu latausmatriisi, tätä ei tarvitse tulkita mitenkään

48 Rotated Factor Pattern
SAS-tulostus: rotatoidut lataukset tästä tulkitaan ja nimetään faktorit Rotated Factor Pattern Factor1 Factor2 Factor3 igo11 Internationalization is the only means to achieve the objectives of growth we have set igo4 Growth can be achieved mainly through internationalization igo7 We need to internationalize in order to succeed in the future igo10 It is important for our company to internationalize quickly igo5 There is still enough growth potential in domestic markets igo2 Our company is of optimum size as it is igo3 We seek moderate growth igo1 Strong growth is necessary to ensure our future positions igo8 We need partners in order to internationalize igo6 Risks related to internationalization are too high igo9 We have enough resources to internationalize

49 Faktoreiden tulkinta Factor 1: international growth orientation – suuret arvot kuvaavat halua voimakkaaseen kansainväliseen kasvuun Factor 2: status quo orientation – suuret arvot kuvaavat halua pitäytyä nykykoossa Factor 3: lack of resources – suuret arvot kuvaavat resurssien riittämättömyyttä kasvuun Huom! Negatiivinen lataus tarkoittaa, että väittämä korreloi negatiivisesti muiden samalle faktorille kuuluvien kanssa. Niitä ei voi sellaisenaan käyttää summamuuttujien laskennassa vaan ne on ensin uudelleenkoodattava

50 SAS-tulostus: selitysosuudet
Variance Explained by Each Factor Factor1 Factor2 Factor3 Rotaation seurauksena kunkin faktorin suhteellinen selitysosuus vaihtelusta voi hieman muuttua, tässä factor1 osuus laski ja muiden nousi vastaavasti

51 SAS-tulostus: kommunaliteetit
Final Communality Estimates: Total = igo1 igo2 igo3 igo4 igo5 igo6 igo7 igo8 igo9 igo10 igo11 Rotaatio ei muuta muuttujien kommunaliteetteja

52 Standardized Scoring Coefficients
SAS-tulostus Standardized Scoring Coefficients Factor1 Factor2 Factor3 igo11 Internationalization is the only means to achieve the objectives of growth we have set igo4 Growth can be achieved mainly through internationalization igo7 We need to internationalize in order to succeed in the future igo10 It is important for our company to internationalize quickly igo5 There is still enough growth potential in domestic markets igo2 Our company is of optimum size as it is igo3 We seek steady growth igo1 Strong growth is necessary to ensure our future positions igo8 We need partners in order to internationalize igo6 Risks related to internationalization are too high igo9 We have enough resources to internationalize Faktoripistemäärien laskemisessa käytetyt muuttujien painokertoimet, tulevat latausten perusteella ja ei tarvitse tulkita

53 Plot: faktorilataukset rotaation jälkeen

54 Output data

55 SAS-koodi PROC FACTOR DATA=KIRJASTO.DATANIMI METHOD=PRIN VARDEF=DF SINGULAR=1E-08 NFACTORS=11 MINEIGEN=1 PRIORS=ONE ROTATE=VARIMAX NORM=KAISER PLOTS=LOADINGS PLOTS=SCREE NPLOT=2 REORDER SIMPLE CORR MSA OUT=KIRJASTO.FACTFactorsDATANIMI(LABEL="Estimated factor scores for KIRJASTO.DATANIMI") ; VAR igo1 igo2 igo3 igo4 igo5 igo6 igo7 igo8 igo9 igo10 igo11 RUN; Footer

56 SAS-tulostus describe-komennosta uudelle datalle
Faktoripistemäärät ovat määrittelemässäsi uudessa datassa uusina muuttujina, joita voi analysoida kuten mitä tahansa jatkuvia muuttujia Variable Label Mean Std Dev Min Max N Factor1 Factor2 Factor3 international growth orientation factor status quo orientation factor lack of resources factor 2.934E E-17 1.268E-17

57 Summamuuttujan laskenta
Voit vaihtoehtoisesti käyttää jatkoanalyyseissa faktoripistemäärien sijaan summamuuttujia Summamuuttujat lasketaan ja niiden reliabiliteetti tarkistetaan kullekin faktorille erikseen Negatiivisesti latautuneet väittämät on uudelleenkoodattava ennen reliabiliteetin ja summamuuttujan laskemista Esimerkkinä faktorille 1 laskettu reliabiliteetti luennon 3 lopussa

58 Raportointi

59 Raportointi Mainittava
Edellytyksistä MSA Overall ja korrelaatiokertoimien vaihteluväli tai tilastollisesti merkitsevien osuus Faktorointimenetelmä Miten faktoreiden lkm päätettiin Rotaatiomenetelmä Muut asiat taulukkoon esim. seuraavasti

60 Raportointi Rotatoidut lataukset Item Faktori1 Faktori2
Kommunaliteetti MSA Muuttuja1 .86 .77 .80 Muuttuja2 .82 .70 .78 Muuttuja3 .65 .58 .66 Muuttuja4 .73 .60 Muuttuja5 .41 .50 .55 Ominaisarvo 2.5 1.0 Cum.% Cronbach alpha .68


Lataa ppt "Kvantitatiiviset tutkimusmenetelmät"

Samankaltaiset esitykset


Iklan oleh Google