Tommi Kauppinen ja Tuukka Sarvi

Slides:



Advertisements
Samankaltaiset esitykset
S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Esitelmä 10 – Juho Kokkala Optimointiopin seminaari - Syksy 2010 Kernel-tasoitus.
Advertisements

Kausaaliverkot ja todennäköisyyslaskennan kertaus Sivut 3-17
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 2 - Kim Björkman Optimointiopin seminaari - Kevät 2007 / 1 Yksiulotteiset kuvaukset.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 3 - Riikka-Leena Leskelä Optimointiopin seminaari - Syksy 2005 / 1 2. Mallien rakentaminen.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Ari Tiainen Optimointiopin seminaari - Kevät 2005 / 1 Käänteisoptimointiin perustuvat huutokaupat.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Fraktaalit – Ville Brummer Optimointiopin seminaari - Kevät 2007 Fraktaalit Ville Brummer.
Elinkeinopoliittinen mittaristo 2014 Pelkosenniemi 1.
Elinkeinopoliittinen mittaristo 2014 Kemi 1. ELINKEINOPOLITIIKAN TILA 2.
Elinkeinopoliittinen mittaristo 2014
S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Esitelmä 20 – Karin Ahlbäck Optimointiopin seminaari - Syksy Esitelmä.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 15 – Mikko Harju Optimointiopin seminaari - Kevät 2010 Kotitehtävä 15.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 16 - Jarto Niemi Optimointiopin seminaari - Kevät 2007 Kaaos differentiaaliyhtälöissä,
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 3 - Outi Somervuori Optimointiopin seminaari - Kevät 2010 The trouble with choice: Studing.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 28 – Tuukka Sarvi Optimointiopin seminaari - Syksy 2005 / 1 Ratkaisu kotitehtävään 28 Tuukka.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmöijän nimi Systeemitieteiden kandidaattiseminaari – Syksy/Kevät 200X Dynaamiset kausaaliset.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 27 – Tommi Kauppinen Optimointiopin seminaari - Syksy 2005 / 1 Oppiminen Bayes-verkoissa.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 29 – Janne Ojanen Optimointiopin seminaari - Syksy Dynaamiset Bayesverkot Osa 1.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Kotitehtävä 14 – Tom Lindström Optimointiopin seminaari - Syksy 2005 Kotitehtävän 14 ratkaisu Tom.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 21 – Osmo Salomaa Optimointiopin seminaari - Syksy 2005 / 1 Kolmioimattomat määrittelyalueverkot.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 11 - Teemu Mutanen Optimointiopin seminaari - Syksy 2005 / 1 Lisätiedon arvo.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 11 - Teemu Mutanen Optimointiopin seminaari - Syksy 2005 / 1 Kotitehtävä 11 - ratkaisu.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Mark Mehtonen Optimointiopin seminaari - Kevät 2005 / 1 Tarjontaketjun hallinta ja sähköinen kaupankäynti.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 9 – Henri Hytönen Optimointiopin seminaari - Kevät 2007 Kaoottiset attraktorit
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 15 – Mikko Harju Optimointiopin seminaari - Kevät 2010 Korreloitu tasapaino ja sosiaaliset.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Tiina Turunen Optimointiopin seminaari - Kevät 2005 / 1 Tiedon louhinta osa II Miten optimoinnin.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 7 – Tommi Nieminen Optimointiopin seminaari - Syksy 2005 / 1 Etäisyysmitat ja Batch learning.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Carlo Vainio Optimointiopin seminaari - Kevät 2005 / 1 Käänteisoptimointiin perustuvat huutokaupat.
S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Esitelmä # - Esitelmöijän nimi Optimointiopin seminaari - Syksy 2010 Lineaarinen.
Optimoinnin käyttö tiedonlouhinnassa
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 24 – Teppo Voutilainen Optimointiopin seminaari - Syksy 2005 / 1 Datakonflikti ja herkkyys.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 19 - Heikki Henttu Optimointiopin seminaari - Syksy 2005 / 1 Ratkaisu kotitehtävään 19.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 9 - Jaakko Niemi Optimointiopin seminaari - Syksy 2005 / 1 Virittäminen (Tuning) s
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Mallinnusmenetelmät 5 – Emilia Partanen Optimointiopin seminaari - Syksy 2005 Mallinnusmenetelmät.
S ysteemianalyysin Laboratorio Aalto-yliopiston Teknillinen korkeakoulu Esitelmä 10 – Epäoikeudenmukaisuuden karttaminen Tuomas Nummelin Optimointiopin.
S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Esitelmä 17 – Tuomas Nummelin Optimointiopin seminaari - Syksy 2010 Tukivektorikoneet.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 6 - Erkka Ryynänen Optimointiopin seminaari - Syksy 2005 / 1 Bayesin verkot Mallinnus metodeita.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 2 - Jirka Poropudas Optimointiopin seminaari - Kevät 2005 / 1 Bayes-verkoista s
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 14 - Tom Lindström Optimointiopin seminaari - Syksy 2005 Vaikutuskaaviot Sivut
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 15 – Anna Matala Optimointiopin seminaari - Syksy 2008 Kotitehtävän ratkaisu Anna Matala.
Hyöty ja yhden toiminnan mallit
S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Esitelmä 11 – Tuomas Nummelin Optimointiopin seminaari - Syksy 2010 Lokaalit uskottavuusmenetelmät.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Lasse Johansson Systeemitieteiden kandidaattiseminaari – Syksy 2009 Vaikutuskaaviopelit Lasse Johansson.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Heikki Vesterinen Systeemitieteiden kandidaattiseminaari – Syksy 2009 Epälineaarinen hinnoittelu:
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 5 - Henri Tokola Optimointiopin seminaari - Syksy 2009 Työpajan skedulointi rajoiteohjelmoinnilla.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Kotitehtävä 19 – Ville Koponen Optimointiopin seminaari - Syksy 2009 Kotitehtävä 19 (Kirja12.7)
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 30 - Aatu Kaapro Optimointiopin seminaari - Syksy 2005 / 1 Dynaamiset Bayes-verkot Osa.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 25 - Mark Mehtonen Optimointiopin seminaari - Syksy 2005 / 1 The Chain Rule for Influence.
S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Ohjaamaton oppiminen– Heikki Vesterinen Optimointiopin seminaari - Syksy 2010 Ohjaamaton.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 1 - Jirka Poropudas Optimointiopin seminaari - Syksy 2000 / 1 Kotitehtävän 2 ratkaisu Jirka.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmöijän nimi Systeemitieteiden kandidaattiseminaari – Syksy/Kevät 200X Virheraportoijien jakaumat.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Mikko Luttinen Optimointiopin seminaari - Kevät 2005 / 1 Vedonlyönti internetissä Mikko Luttinen.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 23 – Juho Kokkala Optimointiopin seminaari - Syksy 2005 / 1 IEJ-puut, yhteisjakaumat, A-kyllästetyt.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 9 - Jaakko Niemi Optimointiopin seminaari - Syksy 2005 / 1 Kotitehtävä 9 Ratkaisu.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 1 Ehdollisten todennäköisyyksien.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Kotitehtävä 24 – Teppo Voutilainen Optimointiopin seminaari - Syksy 2005 Kotitehtävän 24 ratkaisu.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 21 – Osmo Salomaa Optimointiopin seminaari - Syksy 2005 / 1 Kotitehtävän 21 ratkaisu Osmo.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 13 – Tommi Nykopp Optimointiopin seminaari - Syksy 2005 / 1 Päätösteoreettinen vianhaku.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Janne Nurmi Optimointiopin seminaari - Kevät 2008 Kotitehtävä 4 - Ratkaisu
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 8 – Ilmari Kuikka Optimointiopin seminaari - Kevät 2010 Kotitehtävä 8 Ratkaisu.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 17 – Olli Mahlamäki Optimointiopin seminaari - Syksy 2005 / 1 HUGIN-ohjelmisto Olli Mahlamäki.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 8 – Reda Guerfi Optimointiopin seminaari - Syksy 2009 Taloudellisen tuotantoerän skedulointi.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 5 – Matti Sarjala Optimointiopin seminaari - Kevät 2008 Kotitehtävien ratkaisut
S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Esitelmä 22 – Jussi Kangaspunta Optimointiopin seminaari - Syksy 2010 Ohjaamaton.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä # - Esitelmöijän nimi Optimointiopin seminaari - Syksy 2000 / 1 Potentiaalien kertaus ja.
S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Esitelmä 11 – Tuomas Nummelin Optimointiopin seminaari - Syksy 2010 Tukivektorikoneet.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Pekka Mild Optimointiopin seminaari - Syksy 2005 / 1 Monitavoitteiset vaikutuskaaviot; Ratkaisu.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Tapani Raunio Optimointiopin seminaari - Kevät 2005 / 1 Online huutokaupat.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Kotitehtävä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 1 4. Kotitehtävän ratkaisu.
S ysteemianalyysin Laboratorio Aalto-yliopiston teknillinen korkeakoulu Esitelmä # - Esitelmöijän nimi Optimointiopin seminaari - Syksy 2010 Esitelmä 3.
Monimuuttinimuuttuja-analyyseista
Esityksen transkriptio:

Tommi Kauppinen ja Tuukka Sarvi Oppiminen Bayes-verkoissa II D. Heckerman.  A Tutorial on Learning with Bayesian Networks.  In Learning in Graphical Models, M. Jordan, ed.. MIT Press, Cambridge, MA, 1999.   NIPS 2001 Tutorial: Learning Bayesian Networks From Data. Nir Friedman and Daphne Koller Tommi Kauppinen ja Tuukka Sarvi

Esitelmän sisältö Rakenteen ja parametrien oppiminen Pisteytysmenetelmät Täysi Bayes Epätäydellinen data Case: College plans Yhteenveto

Rakenteen ja parametrien oppiminen Tilanne: meillä on datajoukko ,josta pitää määrittää sekä Bayes-verkon rakenne että parametrit Määritettävä kaaret ja todennäköisyydet Määritellään satunnaismuuttuja S, jonka tilat vastaavat eri rakennevaihtoehtoja Jo pienellä muuttujamäärällä mahdollisia verkkoja suuri määrä (ylieksponentiaalinen) Eri lähestymistapoja: mallien pisteytys ja täysi Bayes

Mallien pistetys Määritetään pisteytysfunktio, joka kertoo kuinka hyvin malli vastaa dataa Etsitään suurimman pistearvon tuottavaa rakennetta Suurin osa Bayes-verkkojen oppimista käsittelevästä kirjallisuudesta keskittyy mallien pisteytykseen ja valintaan Monia pisteytystapoja, esim. likelihood score, cross-validation score Parhaat pisteet saava malli etsitään laskemalla kaikki vaihtoehdot läpi tai käyttämällä jotain etsintäalgorimia rakennevaihtoehtojen S joukossa

Mallien pisteytys: selventävä kuva

Likelihood score Logaritmi todennäköisyydestä, että malli tuottaa annetun datan D: Todennäköisyys saadaan kaavasta: on datasta laskettu parametrijakauma

Cross-validation score Opetetaan malli (päivitetään parametrit) datalla V, jossa on jätetty pois yksi havainto: Lasketaan tn. poisjätetylle havainnolle mitä suurempi tn. saadaan sitä suuremmat pisteet Lasketaan eri havainnot poisjättämällä saadut pisteet yhteen:

Esim. kaksi kolikkoa Kaksi kolikkoa X ja Y sekä data seitsemästä heitosta Kaksi mallia S1 ja S2 Lasketaan likelihood score molemmille 1 2 3 4 5 6 7 X h t Y

Esim. kaksi kolikkoa: malli S1 Halutaan laskea: Bayesin kaavalla: Sijoitetaan, jolloin saadaan: on parametrien priori-jakauma mallissa S1 p(D|S1) on datan priori-todennäköisyys mallissa S1

Esim. kaksi kolikkoa: malli S1 Datasta saadaan: Priori-tn. oletetaan tasajakautuneeksi: Datan priori-tn. integroimalla: Nyt saadaan alkup. lauseke:

Esim. kaksi kolikkoa S1:lle saadaan likelihood score: Vastaavasti lasketaan S2:n likelihood score: S2:n pistemäärä suurempi => S2 on parempi malli datan valossa Tämä on järkevää kun tarkastellaan dataa

Täysi Bayes Lasketaan datan perusteella posteriori-todennäköisyydet p(S|D) ja jokaiselle mallille p(S|D) Bayesin kaavasta: Käytetään saatuja posteriori-todennäköisyyksiä laskettaessa haluttuja odotusarvoja Esim. lasketaan datajoukkoa D seuraavan havainnon jakauma:

Täysi Bayes: selventävä kuva

Täysi Bayes vs. pisteytys Täysi Bayes –menetelmässä säilytetään mukana kaikki mallit Pistetysmenetelmissä valitaan paras malli Täysi Bayes antaa kattavampia ennusteita kaikki mahdollisuudet säilytetään mukana Täysi Bayes laskennallisesti raskasta mahdollisia malleja suuri määrä Käytännössä parempi käyttää pisteytysmenetelmää

Epätäydellinen data Datan epätäydellisyydessä voidaan erottaa kaksi eri tapausta Puuttuvat arvot datassa Puuttuvat tai piilotetut muuttujat (hidden variables)

Puuttuvat arvot datajoukossa ja EM (expectation maximization) EM on metodi, jossa puuttuvat arvot datassa täydennetään olemassa olevan Bayes-verkon avulla Saatuja arvoja käytetään kuin mitattuja

Esim. EM (expectation maximization): Data: oletetaan tunnetuksi: Tästä saadaan arviot eri yhdistelmille X, Y. N(X,Y): X h t Y ? Z X Y # h 1.3 t 0.4 1.7 1.6

Puuttuvat muuttujat (hidden variables) Ei suoraa metodia löytää puuttuvia solmuja Erilaisia heuristisia metodeja olemassa puretaan toisistaan riippuvien muuttujien osaverkko kulkemaan yhteisen muuttujan kautta Testataan verkkoa epäilyttävissä kohtaa lisäämällä mahdollisia puuttuvia muuttujia ja vertailemalla saatujen verkkojen ilmenemistodennäköisyyksiä alkuperäiseen

Puuttuvat muuttujat: selventävä kuva (a) Datan perusteella saatu verkko (mitatut muuttujat) (b) Ehdotus puuttuvien muuttujien lisäämiseksi

Case: College plans Muuttujat: sex (SEX): male, female; socioeconomic status (SES): low, lower middle, upper middle, high; intelligence quotient (IQ): low, lower middle, upper middle, high; parental encouragement (PE): low, high; college plans (CP): yes, no Data: tiedot 10318 Wisconsin high school oppilaista Tarkoitus: saada tietoa muuttujien syy-seuraus-suhteista Lähteet: data Sewell & Shah (1968) ja analyysi D. Heckerman (1999)

Case: College plans Kuvassa kaksi todennäköisintä rakennetta Epäilyttävää: SES vaikuttaa suoraan IQ:iin

Case: College plans Lisättiin puuttuva muuttuja H selittämään muuttujia IQ ja SES Malli 2*1010 kertaa todennäköisempi kuin paras malli ilman muuttujaa H Muuttuja H vastaa ”vanhempien laatua”

Yhteenveto: oppivat Bayes-verkot Auttaa mallin rakentamisessa Opitaan kahta asiaa: parametrit (todennäköisyydet) ja rakenne (kaaret) Käytännössä tärkein menetelmä: parhaan rakenteen ja parametrien etsiminen pisteytysmenetelmillä Epätäydellisen datan kaksi tapausta: puuttuvat arvot ja puuttuvat muuttujat Suuri potentiaali, monia toimivia sovelluksia

Kotitehtävä 28 (a) Todista, että N muuttujan tapauksessa mahdollisten verkkojen määrä on suurempi kuin N! (ylieksponentiaalinen). (3p) (b) Keksi ongelma, johon voisit käyttää oppivia Bayes-verkkoja. Listaa tutkittavat muuttujat ja kerro mistä saat dataa mallisi opettamiseksi. (3p)