tilastollinen todennäköisyys tilastollinen todennäköisyys on luku, jota suhteellinen frekvenssi lähestyy (esimerkiksi harhaton rahanheitto) klassinen todennäköisyys äärellinen määrä tulosvaihtoehtoja esiintymismahdollisuudet yhtä suuria liittyy esim. tilastollisten testien kysymyksenasetteluun
tilastollinen todennäköisyys ehdollinen todennäköisyys tieto jonkin tapahtuman esiintymisestä muuttaa siitä riippuvien tapahtumien todennäköisyyksiä tilastollinen riippuvuus tapahtumat ovat riippumattomia mikäli tieto tapahtuman B esiintymisestä ei vaikuta tapahtuman A todennäköisyyteen
normaalijakauma Normaalijakauma (= kellokäyrä = Gaussin käyrä) kuvaa usein hyvin havaintojen jakaumaa tilanteissa, joissa muuttuja on useiden osatekijöiden summa käyrä on teoreettinen malli havaintojen jakautumiselle tilastotieteen tärkein jakauma havaintoaineistosta tehdyt otokset approksimoivat usein normaalijakaumaa
normaalijakauma N(μ, σ2) μ = odotusarvo σ = hajonta normaalijakauma voidaan kuvata lyhyesti yhtälöllä: N(μ, σ2) μ = odotusarvo σ = hajonta käytännön tilanteissa odotusarvoa (μ) kannattaa approksimoida aritmeettisella keskiarvolla teorettiisen jakauman arviointia kutsutaan estimoinniksi keskiarvo ja hajonta kuvaavat havaintoarvojen jakaumaa sitä paremmin, mitä paremmin normaalijakauma approksimoi havaintoaineiston jakaumaa
normaalijakauma normaalijakauman ominaisuuksia: kuvaaja yksihuippuinen; maksimiarvo pisteessä x=μ symmetrinen, “kirkonkellon” muotoinen sivukuva odotusarvon (μ) ympärillä kupera ulospäin pisteissä (μ-σ) ja (μ+σ) käännepisteet saa posititvisia arvoja kaikille x:n arvoille kuvaajan ja vaaka-akselin pinta-ala = 1
normaalijakauma kaikille normaalijakaumille pätee: 68% kuvaajan ja vaaka-akselin välisestä pinta-alasta välillä (μ-σ), (μ+σ) 95% pinta-alasta välillä (μ-2σ), (μ+2σ) 99.7% pinta-alasta välillä (μ-3σ), (μ+3σ) standardoitu normaalijakauma esitetaään kaavalla: z = x –μ σ
normaalijakauma Normaalijakauman pinta-ala on keskeinen tekijä todennäköisyyksiä (0-1) arvioitaessa aikaisemmin käytettiin valmiita taulukoita nykyisin tilastolaskentaohjelmat antavat suoraan halutut pinta-alat standardoitu normaalijakauma kertoo kuinka monta havainnon mittaa havaintoarvo poikkeaa kaikkien havaintojen keskiarvosta
normaalijakauma… z = xi –x xi = muuttujan havaitut arvot si x = keskiarvo si = hajonnat Esimerkki: onko vainaja A (196 cm) poikkeuksellisen pitkä (keskiarvo 180 cm, hajonta 5 cm)? z = xi –x = 196-180 = 3.2 sx 5 Vastaus: vainaja A on poikkeaa yli kolmen hajonnan verran pituuksien keskiarvosta (vähemmän kuin 0.3 % havaintoaineiston vainajista on yhtä pitkiä tai pitempiä)
otanta otanta populaatiosta kerätään joukko yksilöitä analyysiä varten otoksen riippumattomuus tärkeää satunnaisvalinnan toteuttaminen oleellista usein noudatetaan jotain otantakehikkoa voi olla joko “täydellinen” tai “epätäydellinen”
otanta otanta äärellisestä populaatiosta yksinkertainen (umpimähkäinen) satunnaisotanta (simple random sampling) populaatio muodostuu N havainnosta, josta otetaan kokoa n oleva yksinkertainen satunnaisotanta jokaisella n:n kokoisella osajoukolla on sama todennäköisyys muodostaa otos Esim. satunnaisotanta Suomen kunnista
otanta Ositettu otanta (stratified sampling) kokoa N oleva populaatio jaetaan ennakkotiedon perusteella m ositteeseen (strata), joiden koot ovat N1, N2,…Nm kussakin ositteessa sovelletaan yksinkertaista satunnaisotantaa pyritään mahdollisimman homogeenisiin ryhmiin Esim. Suomen kunnat kannattaa jakaa ensin kaupunkeihin ja muihin kuntiin
otanta Systemaattinen otanta (systematic sampling) kokoa N olevan populaation alkiot numeroidaan ja järjestetään otoksiksi valitaan tasavälisesti joka k:s havainto ensimmäinen havainto valitaan satunnaisesti ensimmäisen k havainnon joukosta Esim. 70 henkilön populaatio (järjestetty painon mukaan pienimmästä suurimpaan); valitaan 7 hengen otos; ensimmäinen umpimähkäisesti valittu havainto (henkilö) on nro 5: seuraavat ovat: 15, 25, 35, 45, 55, 65
otanta Ryväsotanta (cluster sampling) otosyksiköt muodostavat ryhmiä eli rypäitä poimitaan umpimähkäinen otos rypäiden muodostamasta perusjoukosta kaikkiin rypääseen kuuluvuun otosyksiköihin kohdistetaan tutkimukseen kuuluvat mittaukset esim. perheet muodostavat rypään haastattelija haastattelee kaikki perheen jäsenet samalla kertaa