TUME II / Tilastollinen osuus Tilastollinen riippuvuus

Slides:



Advertisements
Samankaltaiset esitykset
TUME II / Tilastollinen osuus
Advertisements

MB 3 Lineaarisia polynomifunktioita
Tilastollista päättelyä
TUME II / Tilastollinen osuus
Kartoitustulosten havainnollistaminen Case TaY:n kirjasto
Peruskysymys: onko asteikko luonteeltaan luokitteleva vai jatkuva?
Mikko Tyrväinen InSitu –Luentopalautejärjestelmän tekninen evaluointi.
MIELIPIDEKYSELY SOSIAALI- JA TERVEYSPALVELUJEN TUOTTAMISESTA elokuu 2008.
TUME II / Tilastollinen osuus
eSavonia ”Verkko-opetuksen hyvät käytänteet
TYTILM1 Tilastolliset menetelmät
TUME II / Tilastollinen osuus
Hypoteesin testeistä Testin valinta perustuu aina tutkimusongelmaan ja kuvailuun (joka perustuu mitta-asteikoihin) Testaus ei koskaan ole itsenäinen, vaan.
Kasvatustyön suunnittelu ja toteutus (ryhmissä)
Perheasema & palkkaura: Mitä väittää teoria? Mitä vastaa empiria? Perhevapaiden palkkavaikutukset –seminaari
Oppia ikä kaikki - Työkaluja yhteisöllisyyden kehittämiseen syksy 2014
Riippuvuus tupakoinnista
Vain demonstraatio- käyttöön © Menetelmäopetuksen tietovaranto 1 / 8 Ristiintaulukointi Ristiintaulukointia käytetään tutkittaessa kahden luokittelu- tai.
Näkökulmia tilastojen tulkitsemiseen Käytä oikeita käsitteitä.
Tutkimus osuuskuntien alueellisesta syntyvyydestä Panu Kalmi / HKKK ja RUN Pellervon Päivä Helsinki.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 3 - Outi Somervuori Optimointiopin seminaari - Kevät 2010 The trouble with choice: Studing.
FINGERPORI
TUME II / Tilastollinen osuus
Käyttäytymistieteiden laitos
Elliptiset jakaumat Esitys 6 kpl Tuomas Nikoskinen Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta.
Amiram D. Vinokur & Michelle van Ryn Social Support and Undermining in Close Relationships: Their Independent Effects on the Mental Health of Unemployed.
SATTUMAN ONGELMA TUTKIMUKSESSA 1 x: tenttiin valmistautumiseen käytetty aika (tunteja) Perusjoukko μ = 39,87.
Riippuvuus tupakoinnista
Otanta Miksi otantaa? –suuresta perusjoukosta voidaan saada tarvittavat tiedot edullisemmin kuin kokonaistutkimuksella –kiireisyys vaatii usein otantaa.
Muuttujien riippuvuus
lineaarinen regressio
Lapsuuden sosioekonomisen aseman vaikutus itsekorosteisiin arvoihin valtiotieteellisen tiedekunnan opiskeiljoilla Veikko Eranti.
Korrelaatio Kertoo kahden muuttujan välisestä lineaarisesta yhteydestä eli kuinka hyvin toisen muuttujan avulla voidaan ennustaa toisen muuttujan vaihtelua.
Standardointi tekee eri asteikollisista muuttujista vertailukelpoisia
1 Lastensuojelun tieto lapsesta Mirva Makkonen Kehittäjä-sosiaalityöntekijä Oulun seudun lastensuojelun kehittämisyksikkö.
TUME II / TILASTOLLINEN OSUUS DATAN LAATU SEPPO RÄSÄNEN SAVONIA-AMK TERVEYSALA KUOPIO KEVÄT TYTUT21.
Riippuvuus tupakoinnista
Tilastollinen testaus Mann-Whitneyn –testiä voidaan käyttää hyvin pienille n 2 ≤ 8 keskikokoisille 9 ≤ n 2 ≤ 20 suurille n 2 ≥ 20 otoksille –voidaan käyttää.
Ohjelmistotekniikka ja projektinhallinta, 4 op
2 Tutkimuksen suunnittelu
Mihin on tultu?. Tutkimusprosessi (MOTV , muokattu De Vaus 1994, 21 pohjalta): Teoria Hypoteesit Empiiriset mittarit Aineiston kerääminen Aineiston.
5. Datan käsittely – lyhyt katsaus Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman.
YFIA202 Kvantitatiiviset menetelmät, luento YTT Pertti Jokivuori Syksy luento (Ti )
1 Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina klo Porthanian salissa PIV Uusintamahdollisuus rästitentissä ma 15– 17.
17. MIELIHYVÄ JA RIIPPUVUUS TERVEYSTIETO 7. Pohdi  Kirjoita lapulle TÄRKEIN sinulle mielihyvää tuottava asia  Onko mielihyvän lähde hyväksi terveydelle.
Koonti Pohjois-Savon kuntien tilinpäätöksistä 2015 Lähde: Kysely Pohjois-Savon kunnilta, huhtikuu 2016 (ennakkotiedot)
Pohjois-Savon kuntien tilinpäätökset v Lähde: Kysely Pohjois-Savon kunnilta, huhtikuu 2016 (ennakkotiedot)
YFIA202 Kvantitatiiviset menetelmät, luento YTT Pertti Jokivuori Syksy luento (Ti )
Tutkimuksen suunnittelu
REGRESSIOANALYYSI.
YFIA220 Kvantitatiivisten menetelmien syventävä kurssi
YFIA200 Kvantitatiiviset menetelmät, luento
YFIA202 Kvantitatiiviset menetelmät, luento
Kokeellinen tutkimus OPERATIONALISOINTI: tutkittava ilmiö saatetaan mitattavaan muotoon esim. Kuinka väsyneisyys vaikuttaa motorisissa tehtävissä suoriutumiseen?
Persoonallisuuspsykologian peruskysymyksiä (kertaus)
YFIS200 Kvantitatiivisten menetelmien syventävä kurssi
Lineaariset regressiomenetelmät
Monimuuttinimuuttuja-analyyseista
KEUHKOSYÖPÄ …..
Psykoterapian vaikutta-
YFIA202 Kvantitatiiviset menetelmät, luento
YFIA202 Kvantitatiiviset menetelmät, luento
Mekaaninen energia ja työ
YFIS200 Kvantitatiivisten menetelmien syventävä kurssi
TUTKIMUSOTTEET:.
YFIA200 Kvantitatiiviset menetelmät, luento
Riippuvuustarkastelut
Korrelaatio- ja regressioanalyysi
Luento V. Typologia ja tilastotiede
Tilastolliset testit KHI.
Esityksen transkriptio:

TUME II / Tilastollinen osuus Tilastollinen riippuvuus TYTUT21 TUME II / Tilastollinen osuus Tilastollinen riippuvuus Seppo Räsänen Savonia-amk Terveysala Kuopio Kevät 2008 7.4.2017

Tilastollinen riippuvuus… Muuttujien välistä riippuvuutta arvioitaessa pyritään kuvaamaan muuttujien välinen syy – seuraussuhde. Esim. tupakointi on syy ja keuhkosyöpäriski on seuraus. Sanotaan, että tupakointi on selittävä eli riippumaton (independent) muuttuja ja keuhkosyövän riski on selitettävä eli riippuva (dependent) muuttuja. Tupakointi siis selittää keuhkosyövän esiintymisriskiä. Muuttujien välinen riippuvuus voi olla positiivista (yksi kasvaa -> myös toinen kasvaa) tai negatiivista (yksi kasvaa -> toinen pienenee). 7.4.2017

Tilastollinen riippuvuus… Hahmottele jostakin tilanteesta pistekuvio, Onko riippuvuutta? Onko positiivinen vai negatiivinen riippuvuus? Tutkittaessa kahden muuttujan saamia arvoja saatetaan huomata, että muuttujien välillä on selvä riippuvuus, mutta se riippuvuus ei johdu suoraan muuttujista itsestään, vaan jostain muusta ulkopuolisesta tekijästä  eli tutustu muuttujiin tilannekohtaisesti. Muuttujien välistä riippuvuutta voidaan arvioida: 1) graafisesti, 2)testien avulla, 3)regressiolla Suurempi otoskoko antaa luotettavampia tuloksia 7.4.2017

Tilastollinen riippuvuus… Riippuvuuden testaamiseen käytetään mm. Ristiintaulukointia (khii-toiseen testi) Korrelaatiota (Pearson, Spearman) Riippuvuustestauksessa selvitetään, onko kahden muuttujan välillä jotain riippuvuutta Muuttujien välillä voi olla jonkin asteinen riippuvuus, mutta testissä tulee analysoida, onko merkitsevyystaso riittävä Tilastollinen merkitsevyystaso kuvataan p-arvolla (SPSS:ssä *, ** ja *** merkeillä) p<0,001  tilastollisesti erittäin merkitsevä (***) [0%..0,1%[ 0,001≤p<0,01  tilastollisesti merkitsevä (**) [0,1%..1%[ 0,01 ≤p<0,05  tilastollisesti melkein merkitsevä (*) [1%,5%[ 0,05 ≤p<0,1  tilastollisesti suuntaa antava [5%,10%[ 7.4.2017

Tilastollinen riippuvuus… Ristiintaulukointi (crosstabs) Sovelias tapa seurata riippuvuuksia luokitellulle (nominal) tiedolle Ristiintaulukoinnin avulla saadaan 2D-taulukko, jossa voidaan vertailla vaikkapa kahden muuttujan eri kombinaatioiden frekvenssejä Nopea tapa saada aineistosta perustietoa Auttaa päättämään, millaista jatkotutkimusta kannattaa tehdä Auttaa näkemään, millaisia ilmiöitä aineistosta voi nousta Ristiintaulukoinnissa ei nähdä riskitasoa, jolla päättely tehdään  kyseessä suuntaa-antava tieto, jonka perusteella tarkastellaan asiaa tarkemmin Jos toinen muuttuja on luokitteluasteikollinen, niin riippuvuuden testaaminen kannattaa aloittaa ristiintaulukoinnista Ristiintaulukoinnissa kannattaa laskea soluihin prosentit  helpottaa yleensä analyysin tekoa Jatkuva muuttuja luokitellaan ennen ristiintaulukointia 7.4.2017

Tilastollinen riippuvuus… Ristiintaulukointi (crosstabs) Kahden muuttujan riippuvuuden voimakkuutta voidaan mitata kontingenssikertoimen avulla (C) 0 ≤C<1  C<0,2 ei esiinny riippuvuutta, C>0,3 esiintyy riippuvuutta, muutoin riippuvuudesta ei voida tehdä päätelmää Riippumattomuuden testaaminen tapahtuu khii-toiseen testillä (Χ2-testi ) Testin edellytykset: Otos on satunnaisesti valittu perusjoukosta Korkeintaan 20 % odotetuista arvoista saa olla pienempiä kuin viisi Jokaisen odotetun arvon on oltava vähintään 1 7.4.2017

Tilastollinen riippuvuus… Hypoteesit (kaikissa riippuvuustesteissä) Nollahypoteesi: Muuttujien välillä ei ole yhteyttä perusjoukossa. Vastahypoteesi: Muuttujien välillä on yhteyttä perusjoukossa. Päättely p-arvosta (alle 5%, niin vastahypoteesi hyväksytään, 95% luottamustaso)  ”p-arvo ilmaisee, että onko nollasta poikkeava riippuvuus tilastollisesti merkitsevä, vai onko se sattumaa” p-arvo kuvaa hylkäämisvirheen todennäköisyyttä (=kuinka suuri riski otetaan, että tulkitaan ko. riippuvuuden voimakkuus) 7.4.2017

Tilastollinen riippuvuus… Korrelaatio, R Kertoimen arvot välillä [-1..1], nolla tarkoittaa ei riippuvuutta Positiivinen kerroin tarkoittaa sitä, että jos muuttujan1 arvo kasvaa, niin silloin muuttujan2 arvo kasvaa, negatiiviselle arvolle muuttujan2 arvo pienenee Syy-seuraus suhteissa puhutaan syy-muuttujaa selittäväksi muuttujaksi ja seuraus-muuttujaa selitettäväksi muuttujaksi (asiayhteys ratkaisee tilanteen) Riippuvuuden voimakkuus: 0..0,2 ei riippuvuutta 0,2..0,3 ”harmaa alue” 0,3..0,7 heikko, kohtalainen riippuvuus 0,7..1 vahva riippuvuus 7.4.2017

Tilastollinen riippuvuus… Pearsonin korrelaatio Lasketaan vähintään välimatka-asteikolliselle (scale) muuttujalle Spearmanin korrelaatio Lasketaan järjestysasteikon (ordinal) muuttujille (luokitteluasteikollehan oli ristiintaulukointi) Korrelaatioon liittyy selitysaste (prosenttiluku), joka kuvaa kuinka suuren osan selitettävän muuttujan vaihtelusta voidaan selittää selittävän muuttujan avulla. Selitysaste = korrelaatio2 * 100% 7.4.2017

Tilastollinen riippuvuus… Regressio ”Tietty lääke tietyillä annoksilla alentaa verenpainetta tietyn verran” Muuttujien tulee olla scale-asteikollisia Jos muuttujien välinen riippuvuus on lineaarista, se voidaan kuvata matemaattisesti kaavalla y=a+bx, missä x on selittävä (riippumaton) ja y selitettävä (riippuva) muuttuja Lineaarinen regressio toteutetaan pienimmän neliösumman menetelmällä, PNS-menetelmä Regressiolla voidaan siis mallintaa tilannetta  voidaan ennustaa niitä havaintopareja, joita ei ole aineistossa Regression hyvyyttä kuvataan selitysasteen avulla (r2) Kun regressiosuoran kertoimet (a, b) saadaan, tulee tarkastella riippuvuuden luonteen lineaarisuus vaikkapa pistekaavion avulla 7.4.2017

Tilastollinen riippuvuus… Regressioesimerkki (harrastusaika riippuu henkilön iästä) Riippuva (selitettävä) muuttuja, y Riippumaton (selittävä) muuttuja, x y=2,499 + 0,009x Hyvyys = 1,5% ??? 7.4.2017

Tilastollinen riippuvuus… Harjoitus 1 Tarkastele ristiintaulukoinnin avulla kahden luokitellun asteikon riippuvuutta Jos joku muuttuja on jatkuva, tee siitä luokiteltu muuttuja Tarkastele samaa asiaa myös konteingenssikertoimen avulla, tuleeko sama tulos Harjoitus 2 Tarkastele järjestysasteikon muuttujan riippuvuuksia Spearmanin korrelaatiolla, mitä voit tulkita kertoimesta ja merkitsevyydestä Tarkastele Scale-asteikon muuttujien Pearsonin korrelaatiota, mitä voit tulkita kertoimesta ja merkitsevyydestä Tee korrelaatioita kerralla usean muuttujan kesken 7.4.2017

Tilastollinen riippuvuus… Harjoitus 3 Tutki ratsastuskoulussa harrastusajan ja aloitusiän (ikä-harrastusaika) lineaarista riippuvuutta Mikä on PNS-suoran yhtälö? Mikä on mallin hyvyys? 7.4.2017