Eksploratiivinen faktorianalyysi

Slides:



Advertisements
Samankaltaiset esitykset
1. Missä vietät joulun useimmiten?. 2. Missä viettäisit joulun mieluiten?
Advertisements

Juha Kauppinen Consulting oy Työntekijäkysely Tietoja
KULUTTAJAKYSELY TALVEN ENNAKOINNISTA Rengasfoorumi Sales Questor Oy.
45 ajatusta elämästä Music: snowdream Nov 2009 He Yan.
Pääkaupunkiseudun 8. luokkien palvelukyky Espoo, Tapiolan koulu Joulukuu 2013.
Konfirmatorinen faktorianalyysi
Hampuri, Saksa Löytää suunta, joka mahdollistaa Lions Clubs Internationalin saavuttavan sen täyden potentiaalin kansainvälisenä.
Esiopetuksen huoltajat 2014 Generated on :41.
Liikevaihdon kehitys Pirkanmaalla 2009
Osakekurssien tekninen analyysi
Psykologisen mittarin rakenteen tilastollinen analysointi
Mielikuvat ja odotukset senioritaloista
Pelaajakysely Tampereen piirin pelaajille 2013 TKT.
Place client logo here in Slide Master RI Elokuu 2009 Jorma Hakanen Lääkkeiden määrääminen ja rinnakkaislääkkeet –tutkimus.
3.45 3.40.
Hypoteesin testeistä Testin valinta perustuu aina tutkimusongelmaan ja kuvailuun (joka perustuu mitta-asteikoihin) Testaus ei koskaan ole itsenäinen, vaan.
Posterin teko PowerPoint -ohjelmalla
Perusopetuksen huoltajat 2014 Generated on :04.
Päiväkahvit prof. Ollikaisen kanssa Päiväkahviseurana Vesa A. Niskanen.
Laskelma kuntien ja kuntayhtymien menoista v. 2012
1 Senioreiden säästäminen ja maksutavat 2014 SENIOREIDEN SÄÄSTÄMINEN JA MAKSUTAVAT
1 ©TNS 2012 NEUVOLOIDEN VASTAANOTTOJEN ASIAKASTYYTYVÄISYYSMITTAUS Neuvolat - suurten kaupunkien vertailu 2012 Kaupunkikohtainen vertailu.
Yliopistokirjastojen vastaajat palvelukyselyssä 2010 Päivi Jokitalo Kansalliskirjasto. Kirjastoverkkopalvelut marraskuu 2010.
I.R.O. Research Oy vee 10/2000 Mediakäyttö Käyttää vähintään kerran viikossa Tytöt ja pojat *) Kirjat (esim. romaanit, lasten- ja nuortenkirjat)
Väestö Vantaan osa-alueilla
Juha Kauppinen Consulting oy Rakenneselvitykseen liittyviä tutkimuksia Tiedotustilaisuus Karjasillan kirkolla Juha Kauppinen.
Elinkeinopoliittinen mittaristo 2014
Anna tutki: Naisen asema työelämässä.
Markkinointiviestinnän panostusten kehittyminen vuonna 2006 vuoteen 2005 verrattuna SALDO % 43% 33% Kuva 1 Mainosbarometri.
Tutkimuksen taustaa  Aula Research Oy toteutti poliittisten vaikuttajien parissa tutkimuksen julkisista palveluista Suomessa ja Euroopassa – Tutkimuksen.
Kemi-Tornion ja Rovaniemen ammattikorkeakouluopiskelijoiden hyvinvointi 2005 Minna Viuhko Otus rs
Yrittäjien äänestyskäyttäytyminen 50,7 57,6 55,0 23,4 20,3 21,9 11,4 9,3 8,0 5,2 5,5 6,9 4,2 4,5 3,6 0,7 1,7 1,3 1,7 0,0 0,0 0,7 0,0 0,0 2,7 1,0 3,3.
Jakaumista. Frekvenssijakauma Mainostaja kysyy 200 asiakkaalta, kuinka monta kertaa viikossa he lukevat sanomalehteä. Päivät, jolloin luet lehden Frekvenssi.
Kvantitatiivisen aineiston keruu ja analyysi (kl.2011) -harjoitukset pääaineopiskelijoille Mira Kalalahti Käyttäytymistieteiden laitos
USEAN RYHMÄN VERTAILU Biostatistiikka
TUME II / Tilastollinen osuus Tilastollinen riippuvuus
Teknologiateollisuuden tilanne ja näkymät alueittain
Tänään - Vaihto-info, Jani Haapakoski - Sivuaineista * Sivuaineet tutkintorakenteessa * Mitä vaihtoehtoja sivuaineissa on * Miten sivuaineiden opinto-oikeutta.
1 Raha-asioiden suunnitteleminen ja nykyinen rahatilanne Senioritutkimus 2011.
Seinäjoki kisa A Tuomari: Tytti Lintenhofer ALO 12kyl, 4pys Kyl:
Tutkimus osuuskuntien alueellisesta syntyvyydestä Panu Kalmi / HKKK ja RUN Pellervon Päivä Helsinki.
Maatalous, maaseutuyrittäminen rahavirrat 2008 ja 2007 Pohjois-Savo Jari Kauhanen MTK- Pohjois-Savo.
Eksponentiaalinen kasvaminen ja väheneminen
1 Akavalaisten ja kaikkien palkansaajien palkkatietoja Lähde: Tilastokeskus n Palkkarakennetilasto 2007, diat 2-24 n Sektorikohtaiset palkkatilastot.
Maitotaito PIENEN VAUVAN PÄIVÄ Maitotaito.
Finnish Science in International Comparison A Bibliometric Analysis Kommenttipuheenvuoro Outi Krause TKK.
Aikuisdiabeetikkojen hoitovastuun jakautuminen ja hoitoyksiköiden sisäinen työnjako.
Kirsi Peltonen Graduaiheita Syksy 2012 Kirsi Peltonen
Tilastollisia menetelmiä
Käyttäytymistieteiden laitos
1. Usean muuttujan funktiot
HY/SVY – Kvantitatiivinen metodologia verkossa – Rakenneyhtälöt – Reijo Byman 1/17 INDEX Kvantitatiivinen metodologia verkossa Rakenneyhtälöt Reijo Byman.
Heuristinen arviointi Käyttöliittymäseminaari Jere Salonen.
SATTUMAN ONGELMA TUTKIMUKSESSA 1 x: tenttiin valmistautumiseen käytetty aika (tunteja) Perusjoukko μ = 39,87.
Suomen Lääkäriliitto | Finnish Medical AssociationLääkärit Suomessa | Physicians in Finland Tilastotietoja lääkäreistä ja terveydenhuollosta 2014 Statistics.
1. Missä vietät joulun useimmiten?. 2. Missä viettäisit joulun mieluiten?
Menetelmä Markowitzin mallin parametrien estimointiin (aihe-esittely)
Tilastollisesti merkitsevä nousu Tilastollisesti merkitsevä lasku Edelliseen aineistoon KMT 2005 verrattuna* KMT Kevät06 puolivuosiaineisto KMT SYKSY05/KEVÄT06.
Monimuuttujamenetelmistä Lähtökohtana mallittaa muuttujien välinen riippuvuusrakenne. Rakenne tulee sovellusalan teoriasta. Sopiva analyysi valitaan mallin.
YFIS200 Kvantitatiivisten menetelmien syventävä kurssi
UNIVERSITY OF TURKU FAKTORIANALYYSI. U NIVERSITY OF TURKU FAKTORIANALYYSIN PERIAATE Etsitään muuttujajoukosta keskenään korre- loivien muuttujien kokonaisuuksia.
YFIA200 Kvantitatiiviset menetelmät, luento
Persoonallisuuspsykologian peruskysymyksiä (kertaus)
Monimuuttinimuuttuja-analyyseista
YFIA202 Kvantitatiiviset menetelmät, luento
YFIS200 Kvantitatiivisten menetelmien syventävä kurssi
6 Piirreteoriat kuvailevat yksilöiden välisiä eroja
YFIA200 Kvantitatiiviset menetelmät, luento
Risk analysis, risk attitudes
YFIS200 Kvantitatiivisten menetelmien syventävä kurssi
Esityksen transkriptio:

Eksploratiivinen faktorianalyysi Jouko Miettunen, tutkijatohtori, FT Psykiatrian klinikka Oulun yliopisto puhelin: 08-3156923 e-mail: jouko.miettunen@oulu.fi Kvantitatiivinen tutkimus hoitotieteessä, Oulu 19.10.2006

Luennon sisältö Taustaa Teoria ja toteuttaminen Esimerkkejä Lähteitä

Kyselylomakkeen kehittäminen 4/3/2017 Kyselylomakkeen kehittäminen Psykologia, psykiatria, hoitotiede, kasvatustiede, sosiologia, … Lomakkeissa usein liki samoja asioita mittaavia kysymyksiä Etsitään muuttujien yhdistelmistä selittävää mallia, tiivistetään tietoa Etsitään tärkeimpiä muuttujia Kysymysten lukumäärä lomakkeessa Mikä on sopiva (riittävä) määrä? Mahdolliset osa-asteikot

Piilevät muuttujat Monia asioita ei voida mitata suoraan Tarvitaan useita samaa ilmiötä mittaavia muuttujia Esim. älykkyys, sosiaalisuus, konservatiivisuus

Faktorianalyysit Eksploratiivinen faktorianalyysi (ja pääkomponenttianalyysi) [EFA (PCA)] vanhimpia monimuuttujamenetelmiä (Spearman 1904) etsitään muuttujien kombinaatioista selitettävää mallia Konfirmatorinen faktorianalyysi [CFA] tutkitaan valmista mallia ja varmistetaan antaako aineisto tukea ko. mallille

Eksploratiivinen faktorianalyysi

Pääkomponenttianalyysi

EFA vs. PCA Pääkomponenttianalyysi (Principal Component Analysis) luetaan joskus faktorianalyysiksi, mutta se on matemaattisesti ja filosofisesti erilainen menetelmä Menetelmän vaiheet samankaltaiset SPSS –ohjelmassa PCA tehdään FA –valikossa EFA analysoi vain muuttujien välisen yhteisvaihtelun ja PCA analysoi kaiken varianssin

EFA vs. PCA EFA Kokonaisratkaisu (kaikki mukana olevat faktorit) selittää mahdollisimman paljon vaihtelusta PCA Ensimmäinen pääkomponentti selittää mahdollisimman paljon Toinen pääkomponentti selittää jäljellä olevasta vaihtelusta mahdollisimman paljon, jne. Pääkomponentit eivät korreloi keskenään

EFA PCA Normaalijakautuneet muuttujat Usean muuttujan välinen yhteisvaihtelu eli multikollineaarisuus on ongelma Tutkijalla on ennakkokäsitys rakenteesta Halutaan säilyttää kaikki muuttujat PCA Normaalijakautuneet muuttujat ei välttämättömiä Multikollineaarisuus ei ole ongelma Tutkija haluaa selvittää rakennetta (ei ennakkokäsitystä) Muuttujien vähentäminen

Aineiston ominaisuudet Moni asia vaikuttaa siihen milloin aineisto on soveltuva faktorianalyysiin On esitetty erilaisia sääntöjä otoskoko > (5 * muuttujien lkm) 50-100 tapausta = huono 200-300 = melko hyvä → hyvä 500 on erittäin hyvä >1000 on erinomainen Jos korkeat kommunaliteetit (esim. >0.6) niin otoskoon ei tarvitse olla näin iso Comrey and Lee (1992)

Aineiston ominaisuudet Riittävästi vaihtelua Jos kaikki korrelaatiot <0.3 niin aineisto ei sovellu faktorointiin Kliininen vai väestöpohjainen aineisto? Aineiston koko voi pienetä alkuperäisestä koosta puuttuvan tiedon takia Ääriarvot (outliers) kannattaa poistaa

Puuttuvan tiedon huomioiminen Puuttuvaa tietoa voidaan korvata etukäteen Faktorianalyysia tehdessä vaihtoehdot ovat Puuttuvaa tietoa ei saa olla lainkaan ko. muuttujissa (”listwise deletion”) Puuttuva tieto sallitaan, niin että korrelaatioihin otetaan mukaan jos ko. kahdessa muuttujassa ei ole puuttuvaa tietoa (”pairwise deletion”) Puuttuva tieto korvataan muuttujan keskiarvolla

Muuttujien ominaisuudet Jatkuvat muuttujat VAS (Visual Analog Scale) Järjestysasteikkolliset muuttujat Likert - asteikko Kaksiarvoiset muuttujat Joskus muuttujat tulee kääntää Jakaumien vinous usein ongelma (esim. psykiatriassa)

Aineiston riittävyys Kaiser-Meyer-Olkin Testi Testaa korrelaatioiden suhdetta korrelaatioihin joissa mukana osittaiskorrelaatiot - välillä 0 - 1, mitä suurempi niin sitä parempi  - 0.6 on suositeltu alaraja  Bartlettin Sväärisyystesti Testaa kaikkien korrelaatioiden eroa nollasta Tulisi olla p<0.05 Suuri otos antaa helposti merkitsevyyden

Estimointimenetelmät = ”Factor analysis extraction” SPSS-ohjelman vaihtoehdot: (Principal components) Principal Axis Factoring suositeltava Unweighted least squares Maximum likelihood Generalized least squares Alpha factoring Image factoring Näistä löytyy selostusta esim. SPSS-ohjelman ”Helpistä”

Eksploratiivinen faktorianalyysi Analyysin vaiheet Korrelaatio- tai kovarianssimatriisi Estimoidaan faktorilataukset Rotatoidaan ratkaisu Lasketaan faktoripisteet

Korrelaatiot vai kovarianssit? EFA perustuu muuttujien välisiin korrelaatioihin tai kovariansseihin Yleensä korrelaatioihin Korrelaatiot parempia jos muuttujat eri asteikoilla Kovarianssit parempia jos sovelletaan useisiin ryhmiin joilla erilainen varianssi muuttujissa

Muuttujien kommunaliteetit Kunkin muuttujan varianssi jonka faktoriratkaisu selittää Muuttujan ja faktorin välisen korrelaatin neliö (eli latausten neliöiden summa) Aineistosta riippuen riittävä lataus vaihtelee Voidaan poistaa muuttujia harkintaa käyttäen Ei selvää rajaa, esim. 0.30 – 0.50

Faktorien lukumäärän valinta Tulkittavuus? Ominaisarvot (eigenvalues) Faktorilatausten neliöiden summa Usein kriittinen raja on >1 Voi antaa liikaa faktoreita, osa ei tulkittavissa Voi olla suurempi (esim. 1.5) Voi olla pienempi jos faktorit hyvin tulkittavissa Faktorien selitysosuudet Selitysosuus esim. >5% / >10% Tulkittavuus, esim väh. 3 muuttujaa latautuu >0.3 Cattellin Scree-testi (Scree plot) Graafinen menetelmä ominaisarvojen esittämiseen Hayton et al. Organ Res Meth, 7, 191-2005, 2004.

Ominaisarvot ja selitysosuudet

Korrelaatiomatriisit item1*item2 = (item1*F1)(item2*F2)+(item1*F2)(item2*F1)+…

Faktorilataukset Faktorin ja muuttujan välinen korrelaatio (tai regressiokerroin) Muuttuja voi latautua useaan faktoriin voimakkaasti Muuttujan poistaminen ? Mikä on korkea lataus? Ei ole yksikäsitteistä sääntöä 0.30, 0.35, 0.40 ? Tai selvästi suurempi lataus kuin muilla faktoreilla, esim 2-kertainen Faktorissa mielellään vähintään 3 korkeasti latautuvaa muuttujaa tai useita alhaisemmin latautuvia

Rotaatiomenetelmät Akseleita kierretään niin että tulos on parhaiten tulkittavissa Kannattaa aina tehdä Suorakulmaiset eli ortogonaaliset rotaatiot (faktorit ei saa korreloida voimakkaasti) Varimax, Equamax, Quartimax Vinokulmaiset eli oblique rotaatiot (faktorit saa korreloida) Promax, (Direct) Oblimin

Rotaatiomenetelmät Graafinen rotatointi (ei SPSS:ssä) Usein tulos ei oleellisesti muutu eri rotatointimenetelmillä Joskus suositellaan että tehtäisiin sekä suorakulma- että vinorotaatio esim. varimax ja promax

Suorakulmainen rotaatio P´1 P´2 P1 P2

Faktoripisteet Pisteitä käytetään jatkoanalyyseissa normaalien muuttujien tavoin Kyseisen faktorin latauksilla painotettu muuttujien summa muuttujat standardoitu Etuna normaaliin muuttujien summaan että kaikkien muuttujien tieto on mukana, painotukset vaihtelevat

Faktoripisteet Regressiomenetelmä Bartlett score pisteiden keskiarvo = 0 Pisteet voivat korreloida (myös ortogonaalisessa ratkaisussa) Bartlett score Anderson-Rubin menetelmä Korreloimattomat faktoripisteet

Faktorien tulkinta ja nimeäminen Onko korkeasti latautuneilla yhteisiä nimittäjiä? Jos vain yksi muuttuja latautuu erittäin vahvasti ja muut heikommin, ko. muuttuja kuvaa mahdollisesti parhaiten faktoria

Ongelmia tulosten tulkinnassa? Aina ei löydy järkevää tulkintaa kysymykset voi olla sopimattomia teoriaan teoria voi olla väärä Testaa vaihtoehtoisia malleja Konfirmatorinen faktorianalyysi aineisto voi olla pieni tai muuten sopimaton, esim. poikkeaa huomattavasti normaalijakaumasta

Tilasto-ohjelmat Eksploratiivinen faktorianalyysi onnistuu useimmissa tilasto-ohjelmissa Luennon esimerkit SPSS-ohjelmasta Mplus –ohjelma soveltuu luokiteltujen muuttujien faktorianalyysiin (www.statmodel.com)

Faktorianalyysin suorittaminen SPSS-ohjelmalla Analyze Data Reduction Factor

Esimerkki Esimerkkinä on psykoosioireita mittavaan PANSS (Positive and Negative Syndrome Scale) -asteikon rakenne (30 muuttujaa) Mittarista on esitetty useita erilaisia faktoriratkaisuja Aineistona on Pohjois-Suomen vuoden 1966 syntymäkohortin psykoottisia henkilöt jotka osallistuivat haastatteluun 1999-2001 Pieni aineisto (N=85) Muuttujat likert-asteikolla (1-5) Muuttujissa on vaihtelua

Aineisto soveltuu faktorointiin K-M-O tunnusluku > 0.6 Bartlettin testi: p<0.05

Scree –testi tukee 5 faktorin ratkaisua

Tulostuksen komponenttimatriisit Rotatoimaton ratkaisu EFA: Faktorimatriisi PCA: Komponenttimatriisi Rotatoitu ratkaisu EFA/PCA (suorakulmainen rotaatio): Rotated Component Matrix EFA (vinokulmainen rotaatio): Pattern Matrix Faktoreiden rakennematriisi Structure Matrix Faktorien ja latausten väliset korrelaatiot, jotka suorakulmaisessa tapauksessa olivat suoraan latauksia

Ei rotaatiota Muuttujan kommunaliteetti = (.240)2+(.561)2+…+(.260)2=0.803 Faktorin ominaisarvo (8 faktorilla) = (.240)2+(.536)2+…+(.582)2=10.155

Vinokulmarotaatio Pattern Matrix (= standardoituja regressiokertoimia) tulostuu vain vinorotaatiossa, jolloin tästä otetaan faktorilataukset

Nämä ovat itemin ja faktorin välisiä korrelaatioita

Suorakulmarotaatio - (taulukossa lataus, vain jos >0.3)

Esimerkki

An exploratory factor analysis (principal component analysis, with promax rotation and with unlimited number of factors, eigenvalues over 1 as a criteria) was made to test the replicability of the factor models for the TPQ/TCI subscales. As most of the previous studies have found out that the reward dependence dimension is psychometrically weaker and may consist of two factors, exploratory factor analysis was used instead of confirmatory factor analysis.

Promax rotation was selected as it was used also in the original factor analytic study on the Cloninger’s temperament scales. Since the individual items are 0/1 variables and skewed, the presented factor analyses were done for subscales, as has been done also in most of the previous studies.

Faktorianalyysia voi soveltaa myös muualle kuin kyselyihin. Esim Faktorianalyysia voi soveltaa myös muualle kuin kyselyihin. Esim. aivojen eri alueiden tilavuuksiin! Faktorien nimet: BG = Basal ganglia-Parietal faktori, HIPP = Hippokampus f., TEMP = Temporal f., ERC = Entorhinal f., HASC = dorsolateral prefrontal ja superior temporal cortical gray f. Tien et al. Schizophr Res, 19, 93-101, 1996

Kritiikkiä menetelmälle FA oli pitkään pannassa koska monet valinnoista ja tulkinta ovat subjektiivisia Mikäli menetelmät ja valinnat selitetään hyvin niin se vie kritiikiltä pohjaa Tulkinta ja faktorien nimeäminen voi olla vaikeata (ja jotkut muut voivat olla eri mieltä)

Yhteenveto Faktorianalyysit yms. ovat vain apuväline, psykologinen teoria oltava taustalla Menetelmien etuja ja haittoja: Antaa tilastollisen perusteen osa-asteikkojen käytölle mahdollistaa faktoripisteiden käytön auttaa uusien teorioiden kehittelyssä aineiston ja muuttujien ominaisuudet rajoituksena

Lähteitä suomeksi Leskinen (1997) Faktorianalyysi Metsämuuronen (2003) Tutkimuksen tekemisen perusteet ihmistieteissä Nummenmaa ym. (1996) Tutkimusaineiston analyysi

Muita lähteitä Comrey & Lee (1992) A first course in factor analysis. New York: Hillsdale. Kim & Mueller (1978) Factor analysis: Statistical methods and practical issues. Newbury Park: Sage. Tabachnick and Fidell (2001) Using multivariate statistics (4th edition). New York: Harper & Row.