Lataa esitys
Esittely latautuu. Ole hyvä ja odota
2
Kvantitatiiviset tutkimusmenetelmät
Luento 4 Faktorianalyysi Kaisu Puumalainen
3
Yleistä
4
Tavoite Tiivistää tietoa vähentämällä muuttujien lukumäärää
Löytää muuttujajoukosta piileviä rakenteita – faktori on abstrakti piilevä dimensio, jota yksittäiset muuttujat ilmentävät, vrt. Reflektiivinen mittareiden muodostaminen Keskeinen analyysimenetelmä yhdistettyjen mittareiden muodostamisessa ja validiteettitarkastelussa Auttaa hahmottamaan mitkä muuttujat voisi yhdistää samaan summamuuttujaan Ryhmitellään muuttujia (tai havaintoja, Q-tyyppi) Tyyppejä: Pääkomponenttianalyysi Eksploratiivinen faktorianalyysi Konfirmatorinen faktorianalyysi
5
Perusidea Hyödynnetään muuttujien välistä korrelaatiota yhdistämällä keskenään vahvasti korreloivat muuttujat yhdeksi faktoriksi Interdependence, korrelaatiota mutta ei kausaliteettia Esim. Yrityksen liikevaihto ja yrityksen henkilöstömäärä korreloivat voimakkaasti positiivisesti, niiden välinen regressiosuora vetää yhteen sen tiedon joka kummastakin saadaan – molemmat kuvaavat yrityksen toiminnan mittakaavaa
6
Viiden muuttujan esimerkki, korrelaatiomatriisi
1 2 3 4 5 .75 .80 .85 .10 .05 .00 .60
7
Viiden muuttujan esimerkki, korrelaatiot pallojen leikkauspintoina
1 4 5 3 yhteinen varianssi, faktori 1 2 yhteinen varianssi, faktori 2
8
Vaiheet
9
Vaiheet Muuttujien valinta Edellytysten tarkistus Faktorointimenetelmän valinta Faktoreiden määrän valinta Rotaatio Tulkinta Validointi Jatkoanalyysit
10
Muuttujien valinta Muuttujien oltava jatkuvia, mieluiten intervalli- tai suhdeasteikollisia. Likert ok Ei syy- seuraussuhteessa olevia muuttujia samaan faktorianalyysiin Havaintoja on oltava enemmän kuin muuttujia, suositus havaintoa/muuttuja, min 50 havaintoa, yleensä yli 100 Lähtee korrelaatiomatriisista, joten tulisi olla suhteellisen normaalijakautuneita (ei outlier-havaintoja)
11
Edellytysten tarkistus
Merkitseviä korrelaatioita pitää olla (miel. runsaasti yli .3, suunnalla ei väliä) jos faktorimalli on hyvä niin muuttujaparin väliset osittaiskorrelaatiot (kun muiden muuttujien vaikutus on eliminoitu) ovat pieniä Measure of sampling adequacy (MSA) lasketaan osittaiskorrelaatioista, ja sen tulisi olla jokaisella muuttujalla vähintään 0.5 Jos muuttujan MSA on huono, se voi johtua siitä että muuttuja korreloi vain yhden toisen muuttujan kanssa (kahden muuttujan faktori)
12
Edellytysten tarkistus
Kaiser’s Measure of Sampling Adequacy Overall –tunnusluku on MSA muuttujille kokonaisuutena, ja se kuvaa korrelaatiomatriisin soveltuvuutta faktorianalyysiin MSA-arvo on sitä pienempi mitä suurempia osittaiskorrelaatiot ovat Kaiserin ohjearvot 0.9 marvelous 0.8 meritorious 0.7 middling 0.6 mediocre 0.5 miserable alle 0.5 unacceptable
13
Osittaiskorrelaatio Partial correlation
kahden muuttujan välinen korrelaatio, kun yhden tai useamman muuttujan vaikutus on poistettu (vakioitu) Esim. jäätelon kulutus ja hukkumiskuolemien määrä korreloivat voimakkaasti. Korrelaatio johtuu siitä, että molemmat korreloivat lämpötilan kanssa. mielekäs korrelaatio saadaan laskemalla osittaiskorrelaatio jäätelön kulutuksen ja hukkumiskuolemien määrän välillä, kun lämpötilan vaikutus on poistettu. Myös osittaiskorrelaatio kuvaa muuttujien lineaarista yhteyttä, joka vaihtelee välillä Osittaiskorrelaatio voidaan yleistää useamman muuttujan samanaikaiseen vakiointiin
14
Osittaiskorrelaatio osittaiskorrelaatio x:n ja y:n välillä, kun z:n vaikutus on vakioitu osittaiskorrelaatio x:n ja y:n välillä, kun z:n ja w:n vaikutukset on vakioitu
15
Osittaiskorrelaatio, esim.
x = yrityksen R&D-menot, k€ y = yrityksen nettotulos, k€ korrelaatio rxy= .70 Vau! Innovaatiopanostukset selittävät 49% yrityksen tuloksellisuudesta? z = yrityksen liikevaihto korrelaatiot rxz = .80 ja ryz = .75 osittaiskorrelaatio rxy.z = .25 Kun yrityskoon vaikutus otetaan huomioon, niin selittääkin 6.25% tuloksellisuudesta
16
Faktorointimenetelmän valinta
Muuttujien kokonaisvaihtelu (total variance) jaetaan faktoreihin Pääkomponentti (principal component) Muuttujien yhteinen vaihtelu jaetaan faktoreihin + virhevaihtelu (common variance + unique, ”error” variance) Pääakseli (principal axis / principal factor) Maximum likelihood Alpha factoring
17
Pääkomponentit (principal components)
Haetaan muuttujien lineaarikombinaatioita, tavoitteena tiedon tiivistäminen F1= a*x1+ b*x2 +….. F2= c*x1+ d*x2 +….. Faktoreita aluksi yhtä monta kuin muuttujia Ensimmäinen faktori selittää eniten muuttujien vaihtelusta, toinen toiseksi eniten jne. Kannattaa ottaa lopulta mukaan vain sellaiset faktorit jotka selittävät vaihtelusta enemmän kuin yksi yksittäinen muuttuja
18
Pääakselianalyysi (common factor analysis)
Tiedetään että on olemassa tietty piilevä käsite tai ominaisuus Piilevä ominaisuus on syynä siihen miksi yksittäiset muuttujat saavat tiettyjä arvoja Yksittäisen muuttujan vaihtelu jakautuu kahteen osaan: Yhteinen (common), joka johtuu piilevien ominaisuuksien saamista arvoista Yksittäinen (unique, error), joka ei riipu mistään piilevästä ominaisuudesta Muuttujat ovat lineaarikombinaatioita faktoreista + yksittäinen virhevarianssi x1= a*F1+ b*F2 +….. +u1 x2= c*F1+ d*F2 +….. +u2
19
Montako faktoria? tarpeeksi vähän jotta tieto tiivistyy, mutta tarpeeksi paljon jotta alkuperäisestä tiedosta ei häviä liikaa teorian perusteella, esim. replikaatiot selitysosuus varianssista (percentage of variance explained, esim. 60%) ominaisarvo (eigenvalue, latent root criterion) ykköstä suurempi (paras kun muuttujaa) faktoreiden tulkinta on mielekäs scree test, scree plotista poikki kun viiva tasaantuu
20
Rotaatio ortogonaaliset (Varimax, Quartimax, Equimax) tuottavat keskenään korreloimattomia faktoreita vinorotaatiot (oblique) tuottavat korreloivia (pattern matrix) Factor 2 Factor 1
21
Tulkinta: lataukset loadings
korrelaatio yksittäisen muuttujan ja faktorin välillä vaihteluväli -1…+1 latauksen neliö kertoo montako prosenttia faktori selittää muuttujan vaihtelusta olisi hyvä että jokainen muuttuja saisi itseisarvoltaan suuren latauksen yhdellä ja vain yhdellä faktorilla, mieluiten >.5 rotaatio helpottaa tulkintaa
22
Tulkinta: lataukset katso ensin millä faktorilla kukin muuttuja saa suurimman latauksen, SAS osaa järjestää muuttujat niin että tämä on helppoa jos muuttuja ei saa merkittävän suurta latausta millään faktorilla niin poista se jos muuttuja saa isohkon samansuuruisen latauksen kahdella faktorilla niin kannattaa harkita poistamista katso faktoreittain mitä yhteistä voisi olla siihen latautuvilla muuttujilla, se on faktorin nimi eli piilevä ominaisuus
23
Tulkinta: latauksen merkitsevyys
käytännöllinen: min .3, mielellään .5 tilastollinen: (lataus ja merkitsevyyteen tarvittava otoskoko) .60 85 .70 60
24
Tulkinta: kommunaliteetti
communalities yksittäisen muuttujan tunnusluku, se osuus varianssista jonka faktorit selittävät latausten neliöiden summa vaihteluväli 0…1 tulisi olla mahdollisimman suuri (yli .50) jos on pieni niin muuttujalla on vähän yhteistä muiden muuttujien kanssa, ja se kannattaa jättää pois tarkastelusta tai tutkia erikseen
25
Validointi jotta voisi yleistää on arvioitava ratkaisun stabiilisuutta
puolita aineisto satunnaisesti ja tee sama faktorianalyysi molemmille puoliskoille, samanlaisuutta voi myös analysoida tilastollisesti Kokeile erilaisia faktorointi- tai rotaatiomenetelmiä tarkista ettei ole outlier-havaintoja esim. scatterplotin avulla käyttäytyvätkö faktoripistemäärät teorian mukaisesti
26
Jatkoanalyysit faktoripistemäärät, kärkimuuttujat, summamuuttujat
voit käyttää faktoripistemääriä kuten mitä tahansa jatkuvaa normaalijakautunutta muuttujaa, esim. keskiarvotestit, korrelaatio, regressioanalyysi muista että kaikkien faktoreiden keskiarvo on nolla, eli suoraan pistemääristä ei voi arvioida eri faktoreiden suhteellista merkitystä Jos haluat säilyttää alkuperäisten muuttujien skaalan, käytä faktoripistemäärien asemesta muuttujien keskiarvona laskettua summamuuttujaa
27
SAS ohjelmisto
28
SAS Analyze – Multivariate – Factor analysis
29
SAS – factoring method Faktorointimenetelmän valinta
Faktoreiden määrä, aluksi smallest eigenvalue 1, myöhemmin voit asettaa itse lukumäärän
30
SAS- factoring method Method: pääkomponetti (principal component), pääakseli (principal factor) ja maximum likelihood yleisimmin käytettyjä Number of factors: yleensä aluksi faktorit joilla ominaisarvo on suurempi kuin yksi (selittää enemmän kuin yksittäinen muuttuja keskimäärin), voit määrätä myös tietyn lukumäärän faktoreita, tai minimin selitysosuudelle varianssista
31
SAS - communality
32
SAS- communality Pääkomponenttianalyysissa alustavat kommunaliteetit ovat aina ykkösiä Jos haluat käyttää pääakselimenetelmää sinun tulee edellä valita principal component ja tässä kohtaa valita kommunaliteetiksi joku muu vaihtoehto kuin ykköset, yleensä multippelikorrelaatiokertoimien perusteella (paljonko muut muuttujat selittävät kunkin muuttujan vaihtelusta)
33
SAS – rotation and plots
34
SAS- rotation and plots
Ortogonaaliset ja vinorotaatiot (oblique) ortogonaalinen tuottaa keskenään korreloimattomia faktoreita, isot lataukset suurenevat ja pienet pienenevät, esim. Orthogonal varimax vinorotaatio tuottaa keskenään korreloivia faktoreita Plot factor pattern piirtää kuvion latauksista scree plot: kunkin faktorin ominaisarvojen pieneneminen graafisesti
35
SAS - results Muista tähän oma kirjastosi
Tämä tulkinnan helpottamiseksi Nämä edellytysten tarkistamiseksi
36
SAS-results save output data- factors: tallentaa faktoripistemäärät uusiksi muuttujiksi uusien muuttujien keskiarvoksi tulee nolla, ja varianssiksi yksi (ovat standardoituja muuttujia) Reorder matrix rows by highest absolute loading kannattaa valita tulkinnan helpottamiseksi, tällöin samalle faktorille latautuvat muuttujat ovat allekkain listassa Related statistics antaa perustunnusluvut ja korrelaatiot muuttujille sekä MSA-luvut edellytysten arvioimiseksi
37
Means and Standard Deviations from 280 Observations
SAS-tulostus Means and Standard Deviations from 280 Observations Variable Mean Std Dev igo1 igo2 igo3 igo4 igo5 igo6 igo7 igo8 igo9 igo10 igo11 Tarkista että kaikissa muuttujissa on tarpeeksi hajontaa, 1-5 asteikolla ”hyvä” keskiarvo 2,5 – 3,5 ja keskihajonta noin 1
38
SAS-tulostus korrelaatiomatriisin alku
Correlations igo1 igo2 igo3 igo4 Strong growth is necessary to ensure our future positions Our company is of optimum size as it is We seek steady growth Growth can be achieved mainly through internationalization igo5 There is still enough growth potential in domestic markets igo6 Risks related to internationalization are too high igo7 We need to internationalize in order to succeed in the future igo8 We need partners in order to internationalize igo9 We have enough resources to internationalize
39
SAS-tulostus korrelaatiomatriisin loppu
Correlations igo8 igo9 igo10 igo11 igo5 There is still enough growth potential in domestic markets igo6 Risks related to internationalization are too high igo7 We need to internationalize in order to succeed in the future We need partners in order to internationalize We have enough resources to internationalize It is important for our company to internationalize quickly Internationalization is the only means to achieve the objectives of growth we have set Löytyykö muuttujia jotka eivät korreloi merkitsevästi minkään kanssa
40
SAS-tulostus: osittaiskorrelaatiot
Partial Correlations Controlling all other Variables igo1 igo2 igo3 igo4 igo5 Strong growth is necessary to ensure our future positions Our company is of optimum size as it is We seek steady growth Growth can be achieved mainly through internationalization There is still enough growth potential in domestic markets igo6 Risks related to internationalization are too high igo7 We need to internationalize in order to succeed in the future igo8 We need partners in order to Internationalize Näiden olisi hyvä olla pieniä
41
SAS-tulostus: edellytysten tarkistus
Kaiser's Measure of Sampling Adequacy: Overall MSA = igo1 igo2 igo3 igo4 igo5 igo6 igo7 Kaiser's Measure of Sampling Adequacy: Overall MSA = igo8 igo9 igo10 igo11 Igo8 ja igo1 huonoja, muut ok > .60
42
SAS-tulostus: faktoreiden määrä ja selitysosuus
Eigenvalues of the Correlation Matrix: Total = 11 Average = 1 Eigenvalue Difference Proportion Cumulative 1 0.3748 2 0.1468 0.5217 3 0.1220 0.6437 4 0.0751 0.7188 5 0.0703 0.7891 6 0.0534 0.8425 7 0.0478 0.8903 8 0.0385 0.9288 9 0.0285 0.9573 10 0.0230 0.9803 11 0.0197 1.0000 3 faktoria, joilla ominaisarvo >1. Ne selittävät yhteensä 64% muuttujien vaihtelusta
43
Tulostus: faktoreiden määrä ja selitysosuus
44
SAS-tulostus: muuttujien latautuminen faktoreille
Factor Pattern Factor1 Factor2 Factor3 igo11 Internationalization only means to achieve the objectives of growth igo7 We need to internationalize in order to succeed in the future igo4 Growth can be achieved mainly through internationalization igo10 It is important for our company to internationalize quickly igo6 Risks related to internationalization are too high igo5 There is still enough growth potential in domestic markets igo2 Our company is of optimum size as it is igo3 We seek steady growth igo1 Strong growth is necessary to ensure our future positions igo8 We need partners in order to internationalize igo9 We have enough resources to internationalize Rotatoimattomat lataukset, älä tulkitse vielä näitä
45
SAS-tulostus: faktoreiden selitysosuudet
Variance Explained by Each Factor Factor1 Factor2 Factor3 Sama kuin ominaisarvot, jotka näkyivät jo aiemmassa taulukossa
46
SAS-tulostus: muuttujien kommunaliteetit
Final Communality Estimates: Total = igo1 igo2 igo3 igo4 igo5 igo6 igo7 igo8 igo9 igo10 igo11 Lopulliset kommunaliteetit kertovat kuinka suuren osan kunkin muuttujan vaihtelusta 3 faktoria selittävät, igo2 ja igo3 hieman muita huonompia, yli 0.5 ok
47
SAS-tulostus: muunnosmatriisi
Orthogonal Transformation Matrix 1 2 3 Latausmatriisi kerrotaan tällä matriisilla, jotta saadaan rotatoitu latausmatriisi, tätä ei tarvitse tulkita mitenkään
48
Rotated Factor Pattern
SAS-tulostus: rotatoidut lataukset tästä tulkitaan ja nimetään faktorit Rotated Factor Pattern Factor1 Factor2 Factor3 igo11 Internationalization is the only means to achieve the objectives of growth we have set igo4 Growth can be achieved mainly through internationalization igo7 We need to internationalize in order to succeed in the future igo10 It is important for our company to internationalize quickly igo5 There is still enough growth potential in domestic markets igo2 Our company is of optimum size as it is igo3 We seek moderate growth igo1 Strong growth is necessary to ensure our future positions igo8 We need partners in order to internationalize igo6 Risks related to internationalization are too high igo9 We have enough resources to internationalize
49
Faktoreiden tulkinta Factor 1: international growth orientation – suuret arvot kuvaavat halua voimakkaaseen kansainväliseen kasvuun Factor 2: status quo orientation – suuret arvot kuvaavat halua pitäytyä nykykoossa Factor 3: lack of resources – suuret arvot kuvaavat resurssien riittämättömyyttä kasvuun Huom! Negatiivinen lataus tarkoittaa, että väittämä korreloi negatiivisesti muiden samalle faktorille kuuluvien kanssa. Niitä ei voi sellaisenaan käyttää summamuuttujien laskennassa vaan ne on ensin uudelleenkoodattava
50
SAS-tulostus: selitysosuudet
Variance Explained by Each Factor Factor1 Factor2 Factor3 Rotaation seurauksena kunkin faktorin suhteellinen selitysosuus vaihtelusta voi hieman muuttua, tässä factor1 osuus laski ja muiden nousi vastaavasti
51
SAS-tulostus: kommunaliteetit
Final Communality Estimates: Total = igo1 igo2 igo3 igo4 igo5 igo6 igo7 igo8 igo9 igo10 igo11 Rotaatio ei muuta muuttujien kommunaliteetteja
52
Standardized Scoring Coefficients
SAS-tulostus Standardized Scoring Coefficients Factor1 Factor2 Factor3 igo11 Internationalization is the only means to achieve the objectives of growth we have set igo4 Growth can be achieved mainly through internationalization igo7 We need to internationalize in order to succeed in the future igo10 It is important for our company to internationalize quickly igo5 There is still enough growth potential in domestic markets igo2 Our company is of optimum size as it is igo3 We seek steady growth igo1 Strong growth is necessary to ensure our future positions igo8 We need partners in order to internationalize igo6 Risks related to internationalization are too high igo9 We have enough resources to internationalize Faktoripistemäärien laskemisessa käytetyt muuttujien painokertoimet, tulevat latausten perusteella ja ei tarvitse tulkita
53
Plot: faktorilataukset rotaation jälkeen
54
Output data
55
SAS-koodi PROC FACTOR DATA=KIRJASTO.DATANIMI METHOD=PRIN VARDEF=DF SINGULAR=1E-08 NFACTORS=11 MINEIGEN=1 PRIORS=ONE ROTATE=VARIMAX NORM=KAISER PLOTS=LOADINGS PLOTS=SCREE NPLOT=2 REORDER SIMPLE CORR MSA OUT=KIRJASTO.FACTFactorsDATANIMI(LABEL="Estimated factor scores for KIRJASTO.DATANIMI") ; VAR igo1 igo2 igo3 igo4 igo5 igo6 igo7 igo8 igo9 igo10 igo11 RUN; Footer
56
SAS-tulostus describe-komennosta uudelle datalle
Faktoripistemäärät ovat määrittelemässäsi uudessa datassa uusina muuttujina, joita voi analysoida kuten mitä tahansa jatkuvia muuttujia Variable Label Mean Std Dev Min Max N Factor1 Factor2 Factor3 international growth orientation factor status quo orientation factor lack of resources factor 2.934E E-17 1.268E-17
57
Summamuuttujan laskenta
Voit vaihtoehtoisesti käyttää jatkoanalyyseissa faktoripistemäärien sijaan summamuuttujia Summamuuttujat lasketaan ja niiden reliabiliteetti tarkistetaan kullekin faktorille erikseen Negatiivisesti latautuneet väittämät on uudelleenkoodattava ennen reliabiliteetin ja summamuuttujan laskemista Esimerkkinä faktorille 1 laskettu reliabiliteetti luennon 3 lopussa
58
Raportointi
59
Raportointi Mainittava
Edellytyksistä MSA Overall ja korrelaatiokertoimien vaihteluväli tai tilastollisesti merkitsevien osuus Faktorointimenetelmä Miten faktoreiden lkm päätettiin Rotaatiomenetelmä Muut asiat taulukkoon esim. seuraavasti
60
Raportointi Rotatoidut lataukset Item Faktori1 Faktori2
Kommunaliteetti MSA Muuttuja1 .86 .77 .80 Muuttuja2 .82 .70 .78 Muuttuja3 .65 .58 .66 Muuttuja4 .73 .60 Muuttuja5 .41 .50 .55 Ominaisarvo 2.5 1.0 Cum.% Cronbach alpha .68
Samankaltaiset esitykset
© 2024 SlidePlayer.fi Inc.
All rights reserved.