lineaarinen regressio

Slides:



Advertisements
Samankaltaiset esitykset
Tilastollista päättelyä
Advertisements

Peruskysymys: onko asteikko luonteeltaan luokitteleva vai jatkuva?
Luento 2: Tilastollisen tutkimuksen peruskäsitteet ja menetelmät
Portfolioteoria ja CAP-malli
TUME II / Tilastollinen osuus
TYTILM1 Tilastolliset menetelmät
Hypoteesin testeistä Testin valinta perustuu aina tutkimusongelmaan ja kuvailuun (joka perustuu mitta-asteikoihin) Testaus ei koskaan ole itsenäinen, vaan.
Käyttäytymistieteiden laitos
Kasvatustieteellisen tutkimuksen perusteet
Elinkeinopoliittinen mittaristo 2014 Kittilä 1. ELINKEINOPOLITIIKAN TILA 2.
Elinkeinopoliittinen mittaristo 2014 Kemi 1. ELINKEINOPOLITIIKAN TILA 2.
1 Senioreiden säästäminen ja maksutavat 2014 SENIOREIDEN SÄÄSTÄMINEN JA MAKSUTAVAT
1 ©TNS 2012 NEUVOLOIDEN VASTAANOTTOJEN ASIAKASTYYTYVÄISYYSMITTAUS Neuvolat - suurten kaupunkien vertailu 2012 Kaupunkikohtainen vertailu.
KERTAUSTA PERUSASTEEN MATEMATIIKASTA Piia junes
Elinkeinopoliittinen mittaristo 2014
Jakaumista. Frekvenssijakauma Mainostaja kysyy 200 asiakkaalta, kuinka monta kertaa viikossa he lukevat sanomalehteä. Päivät, jolloin luet lehden Frekvenssi.
Vain demonstraatio- käyttöön © Menetelmäopetuksen tietovaranto 1 / 8 Ristiintaulukointi Ristiintaulukointia käytetään tutkittaessa kahden luokittelu- tai.
TUME II / Tilastollinen osuus Tilastollinen riippuvuus
1 Raha-asioiden suunnitteleminen ja nykyinen rahatilanne Senioritutkimus 2011.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Janne Junes Systeemitieteiden kandidaattiseminaari – Syksy 2009 Tutkimus varasto-virtaussysteemin.
Maitotaito PIENEN VAUVAN PÄIVÄ Maitotaito.
Mentelmätarjotin - monimuuttujamenetelmät
Tilastollisia menetelmiä
Käyttäytymistieteiden laitos
Elliptiset jakaumat Esitys 6 kpl Tuomas Nikoskinen Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta.
tilastollinen todennäköisyys
HY/SVY – Kvantitatiivinen metodologia verkossa – Rakenneyhtälöt – Reijo Byman 1/17 INDEX Kvantitatiivinen metodologia verkossa Rakenneyhtälöt Reijo Byman.
ARVOPAPERISIJOITTAMINEN KAPPALE 7: AKTIIVINEN SIJOITUSSALKUN HALLINTA
Kvantitatiiviset menetelmät
SATTUMAN ONGELMA TUTKIMUKSESSA 1 x: tenttiin valmistautumiseen käytetty aika (tunteja) Perusjoukko μ = 39,87.
Otanta Miksi otantaa? –suuresta perusjoukosta voidaan saada tarvittavat tiedot edullisemmin kuin kokonaistutkimuksella –kiireisyys vaatii usein otantaa.
Muuttujien riippuvuus
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 9 - Jaakko Niemi Optimointiopin seminaari - Syksy 2005 / 1 Virittäminen (Tuning) s
tilastollisen tutkimuksen vaiheet
Vaihteluväli ja keskipoikkeama
Silmän käyttäytymisen tutkimus ja sovellukset Veikko Surakka Tampere University Computer Human Interaction Group.
Tilastollinen testaus Χ 2 -testi nelikentässä kaikkein yksinkertaisin lähtökohta tilastolliselle testille Esim. materiaalin (rauta tai pronssi) ja korun.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 2 - Jirka Poropudas Optimointiopin seminaari - Kevät 2005 / 1 Bayes-verkoista s
Tilastollisesti merkitsevä nousu Tilastollisesti merkitsevä lasku Edelliseen aineistoon KMT 2005 verrattuna* KMT Kevät06 puolivuosiaineisto KMT SYKSY05/KEVÄT06.
Korrelaatio Kertoo kahden muuttujan välisestä lineaarisesta yhteydestä eli kuinka hyvin toisen muuttujan avulla voidaan ennustaa toisen muuttujan vaihtelua.
Standardointi tekee eri asteikollisista muuttujista vertailukelpoisia
Piste- ja väliestimointi:
Tilastollinen testaus Mann-Whitneyn –testiä voidaan käyttää hyvin pienille n 2 ≤ 8 keskikokoisille 9 ≤ n 2 ≤ 20 suurille n 2 ≥ 20 otoksille –voidaan käyttää.
TILASTOTIEDE ARKEOLOGIASSA Har 230h
Mihin on tultu?. Tutkimusprosessi (MOTV , muokattu De Vaus 1994, 21 pohjalta): Teoria Hypoteesit Empiiriset mittarit Aineiston kerääminen Aineiston.
Elliptiset jakaumat Kotitehtävän 6 ratkaisu Tuomas Nikoskinen Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta osin kaikki.
5. Datan käsittely – lyhyt katsaus Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman.
1 Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina klo Porthanian salissa PIV Uusintamahdollisuus rästitentissä ma 15– 17.
YFIA202 Kvantitatiiviset menetelmät, luento YTT Pertti Jokivuori Syksy luento (Ti )
1 Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina klo Porthanian salissa PIV Uusintamahdollisuus rästitentissä ma 15– 17.
YFIA202 Kvantitatiiviset menetelmät, luento YTT Pertti Jokivuori Syksy luento (Ti )
UNIVERSITY OF TURKU MONIMUUTTUJAMENETELMÄT SOSIAALITYÖN TUTKIMUKSESSA Leena Koivusilta Turun yliopisto, Sosiaalipolitiikan laitos.
Määrällinen tutkimus.
YFIA200 Kvantitatiiviset menetelmät, luento
YFIA202 Kvantitatiiviset menetelmät, luento
VARIANSSIANALYYSI.
Havaintoaineiston kuvailusta
YFIA202 Kvantitatiiviset menetelmät, luento
Kritiikin alkulähteillä
YFIA202 Kvantitatiiviset menetelmät, luento
YFIA200 Kvantitatiiviset menetelmät, luento
Parametriset ja Ei-parametriset testit
Tilastolliset tunnusluvut
Riippuvuustarkastelut
Korrelaatio- ja regressioanalyysi
Petteri Nurmi, Eero Huvio, Jussi Kollin & Mikko Waris
Luento V. Typologia ja tilastotiede
Tilastollinen päättely
Tilastolliset testit KHI.
Luento V. Typologia ja tilastotiede
Esityksen transkriptio:

lineaarinen regressio Pearsonin korrelaatiokerroin rxy = nΣ xy – ΣxΣy , √nΣx2 – (Σx)2 √nΣy2 – (Σy)2 muuttujien x ja y välisen lineaarisen yhteyden voimakkuuden ja suunnan mitta kvantitatiivinen tulkinta mahdollinen osoittajan ja nimittäjän yksiköt ovat samat korrelaatiokertoimella ei ole yksikköä molemmilla korrelaatiokertoimilla oletuksena normaalijakauma

frekvenssitaulukko havaintotiedot tallennetaan yleensä frekvenssitaulukoihin moniulotteinen frekvenssitaulukko sisältää vähintään kaksi muuttujaa muuttujien välille voidaan laskea korrelaatioita sisältävät eri mitta-asteikoilla tallennettuja havaintoja voidaan valita sopivia muuttujia analyysejä varten tutkijan kysymysten perusteella

tilastollinen testaus kysymyksenä esim. kuuluvatko havainnot populaatioon, jonka keskiarvo ja keskihajonta tunnetaan Esim. keihäänkärkien pituudet (cm) 17.1, 14.9, 15.2, 18.1, 16.4, 19.1, 18.5, 14.6, 17.2 olkuperäisen populaation keskiarvo 14.8 cm nollahypoteesi (null hypothesis): otokset kuuluvat alkuperäiseen populaatioon H0: μ = 14.8 cm H1: μ ≠ 14.8 cm Z = X – μ X = otoskeskiarvo σ √ n μ = alkuperäisen populaation keskiarvo σ = keskihajonta

Tilastollinen testaus keihäänkärkien pituudet… Z = X – μ = 16.8 – 14.8 = 2.86 σ √ n 2.1 √ 9 mitä enemmän testiarvo poikkeaa nollasta, sitä voimakkaammin se todistaa nollahypoteesia vastaan P(|Z|>2.86 | H0 on tosi) 2[1 – Φ(2.86)] =0.0042 kuvaa testin havaittua merkitsevyystasoa (probablility value tai p-value) phav = 0.0042 eli 0.43 %

Tilastollinen testaus Vaihtoahtoiset johtopäätökset: H0 on tosi, mutta perusjoukosta on saatu harvinainen otos (todennäköisyys tälle on kuitenkin hyvin pieni) H0 ei ole tosi; otos on saatu jostain muusta perusjoukosta (otos todistaa nollahypoteesia vastaan riskitasolla 0.0042) eli todennäköisyys sille, että otos on saatu jostain muusta populaatiosta on suuri Huom. kysymyksessä on kaksisuuntainen testiasetelma

Tilastollinen testaus nollahypoteesin testausvirheet nollahypo-teesi hyväksytty hylätty tosi oikea päätös I tyypin virhe väärä II tyypin virhe

Tilastollinen testaus Yksisuuntainen vaihtoehtohypoteesi P(|Z|>2.86 | H0 on tosi) 1 – Φ(2.86) = 0.0021 I tyypin virheen todennäköisyys vain 0.0021 (vain puolet kaksisuuntaisen vaihtoehtohypoteesin todennäköisyydestä) vain testisuureen suuret positiiviset arvot hyväksytään todisteeksi nollahypoteesia vastaan yksisuuntaisen testiasetelman valinnan perustuttava johonkin lisätietoon

Tilastollinen testaus Merkitsevyystaso (level of significance) mittaa kuinka suuri riski hypoteesin hylkäämiseen liittyy riskiä kuvaa parhaiten merkitsevyystaso aikaisemmin (ennen tietokoneaikaa) käytettiin taulukoihin valmiiksi laskettuja riskitasoja 1.960 merkitsevyystaso 0.05 (5 %) 2.576 merkitsevyystaso 0.01 (1 %) 3.291 merkitsevyystaso 0.001 (0.1 %)

Tilastollinen testaus Tilastollisen testin valintaan vaikuttavia tekijöitä mikä on käytetty mitta-asteikko onko kyseessä jatkuva vai epäjatkuva muuttuja onko muuttuja normaalisti jakautunut ovatko otokset riippumattomia (independent) vai jollakin tavalla riippuvaisia ovatko havainnot toisistaan riippumattomia

Tilastollinen testaus Parametriset testit vaativat voimakkaita oletuksia populaation jakauman muodosta välimatka- ja suhdeasteikoille sopivia testejä Ei-parametriset testit (non-parametric tests) jakaumista riippumattomat testit luokka- ja järjestysasteikolle sopivat testit voidaan testata jakaumien sijaintia koskevia hypoteeseja selvitetään populaatioiden jakaumien muodossa havaittavia eroja

Tilastollinen testaus Yhteensopivuustestit (tests of goodness of fit) selvitetään onko otoksena saatu havaintoaineisto peräisin populaatiosta, jonka jakauma tunnetaan ennalta Riippumattomuustestit (tests of independence) selvitetään ovatko luokitteluperusteena käytetyt ominaisuudet toisistaan riippumattomia vaikuttaako ominaisuuden A esiintyminen ominaisuuden B luokkien esiintymistiheyteen vai esiintyvätkö ne ominaisuudesta A riippumattomasti

Tilastollinen testaus Χ2 yhteensopivuustesti Esim. onko kirveiden pituudella (cm) vaikutusta käyttöjälkien esiintymiselle? 0-9 10-19 20-29 30-39 Σ havaitut frekvenssit Ei kj 7 6 11 15 39 On kj 14 11 5 8 38 Σ 21 17 16 23 77 0-9 10-19 20-29 30-39 Σ odotetut frekvenssit Ei kj 0.6. 8.6 8.1 11.6 39 On kj 10.4 9.0 7.9 11.4 38 Σ 21 17 16 23 77

Tilastollinen testaus Χ2 = Σ Σ (oij – eij)2 oij Χ2 = (7-10.6)2 + (6-9.6)2…(8-11.4)2 =8.173 10.6 8.6 11.4 vapausasteet lasketaan vähentämällä rivien ja sarakkeiden arvoista luku 1 df = (2-1) x (4-1) = 3 Χ20.05 = 7.815 < 8.173 H0 = pituuden ja käyttöjälkien välillä ei ole yhteyttä

Tilastollinen testaus Esim. kirveiden koon ja käyttöjälkien riippuvuus johtopäätös: koska Χ20.05 = 7.815 < 8.173 kirveen koon ja käyttöjälkien välillä on riippuvuutta todennäköisyys, ettei riippuvuutta esiinny on vähemmän kuin 5 % Χ2-testin yleiset käyttöedellytykset korkeintaan 20 % odotetuista frekvensseistä on pienempiä kuin 5 kaikki odotetut frekvenssit ovat suurempia kuin 1