otanta Miksi otantaa? –suuresta perusjoukosta voidaan saada tarvittavat tiedot edullisemmin kuin kokonaistutkimuksella –kiireisyys vaatii usein otantaa –otannassa voidaan tilastoyksiköt tutkia tarkemmin ja tehokkaammin –tiedon saaminen saattaa vaatia tutkimuskohteen tuhoamista –mikäli populaation on ääretön otanta ainoa mahdollisuus
Mittaaminen ja muuttujat Operationalisointi –tutkija hahmottaa, rajaa ja määrittelee käsitteet –käsitteiden analysointi –mittausten indikaattoreiden määrittely –operationalisoinnin tarkka kuvaus Abstraktin käsitteen mittaaminen –paloiteltava konkreettisimmiksi osakäsitteiksi arkeologiassa ei tavallisesti tuota ongelmia
Mittaaminen ja muuttujat Survey-tutkimus –aineiston keruu kysely- ja haastattelu-lomakkeilla tekokas, laoudellinen keskeistä täsmällinen ennakkosuunnittelu usein mielipide-, tai asennetutkimuksia vakiomuotoiset ja helposti ymmärrettävät kysymykset ongelmat: –pinnallisuus –virheriski –puutteelliset tiedot
Survey-tutkimuksen vaiheet tutkimusongelman määrittely perusjoukon määrittely havaintolomakkeen laadinta havaintojen tekeminen aineiston tarkistaminen ja muokkaus aineiston analyysi tutkimusraportin laadinta
Survey-tutkimuksen vaiheet Kysymyslomakkeen laadinnasta –avoimet kysymykset –monivalintakysymykset täydelliset vastausvaihtoehdot Likertin asteikko Guttman-asteikko Kysymyssarjat
Survey-tutkimuksen vaiheet Tiedon tallennus ja syöttäminen –tilastolaskentaohjelmien tallennuspohjat havaintoaineistot –dataluettelot –datataulukot –talletuslomakkeet –taulukkolaskentaohjelmien solut –tietokantaohjelmien tallennuslomakkeet –tekstinkäsittelyohjelmat
lineaarinen riippuvuus regressiomalli –kuvaa kuinka selitettävä riippuu yhdestä tai useammasta selittävästä muuttujasta –lähtökohtana kahden muuttujan yhteisjakauma riippuvuuksia tutkitaan graafisesti –muuttujien arvojen riippuvuutta havainnollistetaan pistediagrammilla –riippuvuuden voimakkuutta mitataan korrelaatiokertoimella
lineaarinen riippuvuus esim. Isien ja heidän poikiensa pituuden riippuvuus riippuvuuden luonne –assosiaatio eli yhteys –ei saa tehdä päätelmiä kausaalisesta yhteydestä syy-yhteys perusteltava muilla tavoilla –näennäisyhteys
lineaarinen riippuvuus x ja y arvot määrittävät pisteiden sijainnin pisteparvena –jos pisteparvi nousee oikealle siirryttäessä riippuvuus on positiivista –jos pisteparvi laskee oikealle siirryttäessä riippuvuus on negatiivista –tilastollinen tapaus on yksilö esine tai ryhmä, jolle tutkittavien muuttujien arvot mitataan
lineaarinen riippuvuus korrelaatiokerron r = 1 Σ (x i – x) x (y i – y) x = keskiarvo n-1 s x s y y = keskiarvo s x = keskihajonta s y = keskihajonta esim. isien ja poikien tapauksessa korrelaatiokertoimeksi saadaan r = Johtopäätös: pitkät isät saavat keskimääräistä pitempiä poikia
lineaarinen riippuvuus Korrelaatiokertoimen ominaisuuksia: –kerroin on välillä –1 ≤ 0 ≤ 1 –arvot –1 ja +1 merkitsevät täydellistä lineaarista riippuvuutta –korrelaatiokerroin on symmetrinen (x:n ja y:n roolin vaihtaminen ei muuta kertoimen arvoa) –korrelaatiokerroin on siirto ja skaalainvariantti –korrelaatiokerroin on herkkä havainnoille, jotka ovat käyräparven reunoilla
lineaarinen riippuvuus Arkeologiset yhteydet –tärkeä merkitys mm. rannan- siirtymisdiagrammien laadinnassa –esim. asuinpaikkojen lineaarinen riippuvuus tuottaa eri-ikäiset rantapinnat –käytetään hyväksi lineaarista regressiomallia
lineaarinen regressio Pienimmän neliösumman suora –regressiomalli sovitetaan havaintoihin mallin kertoimet valitaan siten, että selittävän muuttujan havaittujen arvojen ja regressiomallilla ennustettujen selittävän muuttujan arvojen erotusten (residuaalien) neliösumma minimoituu regressiomallin sopivuutta havaintoaineistoon mitataan slitysasteella regressiomalleja voidaan käyttää myös aikasarjan trendin arviointiin
lineaarinen regressio Suoran yhtälö y = α + βx α = leikkauspiste β = kulmakerroin β > 0 nouseva β < 0 laskeva lineaarinen regressio mahdollistaa myös ennustamisen
lineaarinen regressio Esim. isien ja poikien pituudet –voidaan piirtää kaksi pienimmän neliösumman suoraa –ennuste ehdollisille keskipitoisuuksille hyvä –keskipitoisuuksien vaihtelu kuitenkin suuri pienimmän neliösumman suoran ominaisuuksia: –PNS-suora kulkee painopisteen kautta
lineaarinen regressio –PNS-suorat yhtyvät jos r=± 1 –kulmakertoimen suuruus riippuu korrelaatiokertoimen r lisäksi muuttujien hajonnasta Regressiomallin hyvyyden mittaaminen –PNS-suora minimoi selittävän muuttujan havaittujen ja ennustettujen arvojen erotusten neliösumman –Esim. savukkeiden kulutuksen ja keuhkösyövän yhteys