5. Datan käsittely – lyhyt katsaus Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman
5. Datan käsittely Sisältö Tähtitieteellisten havaintojen virheet Korrelaatio Funktion sovitus Aikasarja-analyysi
5.1 Tähtitieteellisten havaintojen virheet Satunnaiset virheet: Kohina Mittaustarkkuus Systemaattiset virheet: Havaintolaitteen aiheuttamat vääristymät Ympäristön aiheuttamat virheet (esim. ilmakehän vaikutukset havaintoihin, käsiteltiin luvussa 2)
5.1.1 Havaintojen kohina Signaali-kohinasuhde jossa S on signaali = rekisteröityjen fotonien määrä, ja N on kohina Sama spektri eri S/N -suhteella
5.1.2 Havaintolaitteen vaikutukset havaintoihin Aallonpituusherkkyys Resoluutio Laitteen sisäiset sironnat ja heijastumat Optiset virheet Havaintolaitteen liikkuminen Detektorin herkkyysvaihtelut (lämpötilan vaikutus, pikselien herkkyydet …) ym.
5.1.3 Havainnon mittaaminen Havaintolaitteen vaikutus havaintoihin voidaan usein esittää muodossa f ovat ”todelliset” arvot, g on havaintolaitteen antama tulos, h on instrumentin aiheuttama vääristymä ja n ovat satunnaiset virheet
5.1.4 Virheiden poistaminen Kohinan voi suodattaa, mutta resoluutio kärsii Havaintolaitteen vääristymien korjaaminen esim. flat-field -korjaus Huomattavasti poikkeavat arvot: outliers root-mean-square: jossa f on havaintoihin y sovitettava funktio. Outlierin kriteeri:
5.2 Korrelaatio Korrelaatio kertoo kahden muuttajan välisestä riippuvuudesta Korrelaatiokertoimia: Pearson korrelaatiokerroin Spearman järjestyskorrelaatiokerroin Kendallin järjestyskorrelaatiokerroin
5.2.1 Pearsonin korrelaatiokerroin Mittaa lineaarista riippuvuutta Otoksen hajonta: jossa x on keskiarvo Kahden muuttujan välinen kovarianssi: Pearsonin korrelaatiokerroin:
5.2.2 Korrelaation todennäköisyys Nollahypoteesi: x ja y eivät korreloi Oletetaan: x ja y :lle on saatu r xy Mikä on nollahypoteesin todennäköisyys? Jos N on suuri ( N>20 ) => r xy noudattaa normaalijakaumaa Merkitään => todennäköisyys että korrelaatio ”sattumalta” olisi suurempi kuin r xy :
5.3 Funktion sovitus Sovituksen kriteeri yleensä mahdollisimman pieni virheiden neliöiden summa: Sopii erityisesti, jos virheet ovat satunnaisia gaussisesti jakaantuneita
5.3.1 Pienimmän neliösumman menetelmä Sovitettava funktio: Määritellään: ovat pisteet johon sovitetaan funktio
Pienimmän neliösumman menetelmän ratkaisu Jos N=K saadaan yksiselitteinen ratkaisu yhtälöstä A a = y Kuitenkin jotta sovitus olisi luotettava niin Etsimme ratkaisua jossa on mahdollisimman pieni => ratkaisu saadaan normaaliyhtälöistä:
5.3.2 Suoran sovitus Sovitettava funktio
Ratkaisu suoran sovitukseen Saamme ratkaisun yhtälöryhmästä Merkitään ratkaisu:
5.4 Aikasarja-analyysi Parametriset menetelmät: Sovitetaan dataan jaksollinen funktio Esim. Fourier sarjan sovitus Ei-parametriset menetelmät: Etsitään periodisuutta esim. datan maksimeista tai minimeistä Esim. Kuiper- tai Swanepoel & De Beer - menetelmät
Fourier-sarjan sovitus Malli: Huom.: Malli on epälineaarinen => ratkaisua ei saada suoraan pienimmän neliösumman menetelmällä Ratkaisumenetelmä: Three stage period analysis (Jetsu & Pelt 1999) keskiarvo periodi
Esimerkki aikasarja-analyysista Tähden HD valokäyrä, Aikasarja-analyysi
Kirjallisuutta H. Karttunen: Datan käsittely, CSC 1994 W.H. Press et al.: Numerical recipes, kotisivu:
Kurssitiedote: Metsähovin keikka klo Kokoontuminen A.I. Virtasen aukiolla Lähtö Metsähoviin klo 18.00, tilattu linja-auto Metsähovissa n. klo : Teleskoopin ja CCD-kameran esittelyä Havainnot jos sää sallii Vierailu pakollinen osa kurssia, ”keräilyerä” järjestetään myöhemmin