Peliteoria Ks. Esim. Grüne-Yanoff & Lehtinen (tulossa): Philosophy of game theory, Handbook for the philosophy of economics, toim. Uskali Mäki Ross, Don:

Slides:



Advertisements
Samankaltaiset esitykset
Tietopaketti Big Datasta
Advertisements

Yhtälön ratkaiseminen
Jumalan kanssa.
Tämä on SUUNTA-työkalun käyttöön opastava diaesitys
Yksilö ostajana.
Bensan hinta Hyvää päivää, Olen kuullut ennustettavan, että bensan hinta saattaa syksyyn mennessä nousta litralta jopa € 1,90 :een.
TYÖHYVINVOINTI: MITÄ JA MIKSI?
Mitä nuorille kuuluu? Eveliina Karjalainen.  Toisilla näyttää menevän paremmin kuin koskaan, toisilla huonommin kuin koskaan. Molemmat ryhmät tuntuvat.
Kaikkea mahdollista! Tässä esityksessä on arvoituksia ja muuta pakollista asiaan kuuluvaa. Tämä esitys on lopullinen eikä siitä voi valittaa. Aloitetaanpa…
Kohtuullinen korvaus. •Kohtuullinen korvaus tässä yhteydessä tarkoittaa kohtuullista korvausta tekijänoikeuden siirron osalta. •Muissakin tekijänoikeudellisissa.
Tärkeämpää kuin arvaatkaan
Pelin suunnittelu Antti-Jussi Lakanen Nuorten peliohjelmointi 2009 /
Preppaus ENA 4.
NALLE PUH.
Rohkaisusanoja naiselta naiselle
Duaali Teemu Myllynen.
Unrealistic assumptions in rational choice theory.
Kaisa Tuomisto TU08S1E  Tutkimuksen tavoitteet  Käytetyt hakusanat ja osumat  Linux  Tietolähteiden vertailua  Yhteenveto  Viitteet.
1 Helsinki University of Technology Systems Analysis Laboratory Evoluutiopelit evakuointimalleissa - Pelastettavien kovan leikin peliteorettinen kuvaus.
Kahden vaiheen peli (Ruseski JEEM 1998) Oletetaan kaksi valtiota, joissa kalastuslaivaston koko n 1 ja n 2 Ensimmäisessä vaiheessa valtiot valitsevat nämä.
Fi.opasnet.org fi.opasnet.org/fi/Ydinvoima Haluamme tietää Sinun mielipiteesi. Äänestikö kansanedustajasi oikein ydinvoimasta? Kansalaisparlamentti ydinvoimasta.
Todennäköisen käsite alakouluikäisille
TASAPAINON RAKENTAMINEN
Jouni Viuhko 2010 Pilkun käyttäminen.
Portinvartija Jyrki Rasku Mikä on portinvartija? Portinvartija päättää onko MeniTuki ohjelma sopiva pääsyä pyytävälle henkilölle vai ei Ohjelmaan.
Todennäköisyyslaskennan alkeet ennen esikoulua
 Tärkeämpää kuin arvaatkaan 1. Et ole ehkä koskaan tarvinnut varmistuksia, mutta… …ennemmin tai myöhemmin se tapahtuu sinullekin. 2PowerPoint harjoitus.
Realisoituuko työvoimapula - välityömarkkinoistako ratkaisu?
Valmennuskurssi sosiaalitieteiden tutkinto-ohjelmaan
Suotuisan oppimistarinan rakentaminen ET- koulutus/T3/ Tapio Malinen.
Peliteoria ja kalatalous YE4. Kansainväliset kalastussopimukset Tarve kansainväliselle yhteistyölle: Vain kestävillä kansainvälisillä sopimuksilla voidaan.
Kontekstinhallinta ja muut rajapintatarpeet Mika Tuomainen Juha Mykkänen SerAPI-projekti, HIS-tutkimus Kuopion yliopisto, Tietotekniikkakeskus, Centek.
PILKKU.
Murtoluvun supistaminen
− työkalu toiminnan suunnittelun ja suunnitelman arvioinnin tueksi
Kilpailukyky -> kilpailuetu Oppiminen & Kasvattaminen?
Hotellingin mallin testaaminen
Miksi tämä on vaikeaa? Ilman minkäänlaisia rajoitteita ongelmat ei ole vaikeita ratkaista. Siihen löytyy jopa valmis ”kaava”. Valitettavasti jokaisessa.
Pelien -ohjelmointi Syksy 2007 Vapaavalintainen opintojakso 3 op. ITP8TM003.
Algoritminen ajattelu
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 11 - Teemu Mutanen Optimointiopin seminaari - Syksy 2005 / 1 Lisätiedon arvo.
Toistorakenne Toistorakennetta käytetään ohjelmissa sellaisissa tilanteissa, joissa jotain tiettyä ohjelmassa tapahtuvaa toimenpidekokonaisuutta halutaan.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 1 – Simo Heliövaara Optimointiopin seminaari - Syksy 2008 Johdanto peliteoriaan
Kuinka paita ja peppu olettekaan! Pariskuntien välistä leikkimielistä kisailua siitä, kuka tunteekaan kumppaninsa paremmin. Toteutetaan kyselemällä tavalla.
Peliteoria ks. esim. Grüne-Yanoff & Lehtinen (tulossa 2010): Philosophy of game theory, Handbook for the philosophy of economics, toim. Uskali Mäki Ross,
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 15 – Mikko Harju Optimointiopin seminaari - Kevät 2010 Korreloitu tasapaino ja sosiaaliset.
6. Relaatioalgebra ja relaatiokalkyyli
@ Leena Lahtinen Toistorakenne Ohjelmassa toistetaan tiettyjä toimenpiteitä monta kertaa peräkkäin Toisto noudattaa sille kuuluvia tarkkoja standardoituja.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 21 – Jonas Strahl Optimointiopin seminaari - Kevät 2010 Signalointi ja cheap talk
Hotelling, H. (1931). The Economics of Exhaustible Resources
To start press the space bar. Tietojen päivittäminen PAF kantaan käyttäen Temple Ready ohjelmaa ja IGI CD- levyjä CD-ROM:lla on tiedot vuoteen 2000 saakka,
Paljastetut preferenssit ja peliteoria Ks. esim. Grüne-Yanoff & Lehtinen (tulossa) tai Hausman 2000, 2005, Guala 2006.
Toistorakenne Toistorakennetta käytetään ohjelmissa sellaisissa tilanteissa, joissa jotain tiettyä ohjelmassa tapahtuvaa toimenpidekokonaisuutta halutaan.
1 Arrow’n teoreema Sosiaaliset hyvinvointifunktiot (Social welfare functions SWF) SWF f on sääntö tai prosessi, joka määrittää kullekin joukolle yksilöiden.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Janne Nurmi Optimointiopin seminaari - Kevät 2008 Kotitehtävä 4 - Ratkaisu
Monilajimallit YE10. ekosysteemeistä Saalistajat, saaliit, kilpailijat, taudit ym. saattavat vaikuttaa merkittävästi luonnonvaran kasvuun. fysikaalinen.
Robustius Yleinen idea: jokin pysyy muuttumattomana vaikka jotakin muutetaan.
S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 12 – Alexander Franck Optimointiopin seminaari - Kevät 2010 Rationalisoituvuus ja yleinen.
MapInfon tiedostot TAB – Tiedosto, jonka avulla tietokanta avataan MapInfossa. Tiedostossa tietoja kentistä ja koordinaattijärjestelmästä. DAT, XLS. TXT.
Kesätyöntekijöiden kommentteja Opasnetistä ja ydinvoimatyöstä: ”Kun tulin kesätöihin minulla oli vain jokin suuntaa antava aavistus siitä mitä meinattiin.
Toistorakenne Toistorakennetta käytetään ohjelmissa sellaisissa tilanteissa, joissa jotain tiettyä ohjelmassa tapahtuvaa toimenpidekokonaisuutta halutaan.
1 Osa 12b Oligopoli ja monopolistinen kilpailu (Mankiw & Taylor, Chs 16-17) Oligopoli on markkinamuoto, jossa markkinoilla on muutamia yrityksiä, jotka.
Pelien normaalimuoto & Nashin tasapaino Juhani Sipilä The document can be stored and made available to the public on the open internet pages.
Luento Panu Kuosmanen Aalto-yliopisto
Toistorakenne Toistorakennetta käytetään ohjelmissa sellaisissa tilanteissa, joissa jotain tiettyä ohjelmassa tapahtuvaa toimenpidekokonaisuutta halutaan.
Kotitehtävä 1 - Ratkaisu
Viiden suora -peli ristinolla-peli (viiden suora) esim. yhtälön ratkaiseminen, prosenttilaskenta, sähköopin perussuureet (PUImURI) jne. 11x11-ruudukko,
Y56 Luku 29 Peliteoria Varian 2006, luku 28.
Luento Panu Kuosmanen Aalto-yliopisto
Luento Panu Kuosmanen Aalto-yliopisto
Esityksen transkriptio:

Peliteoria Ks. Esim. Grüne-Yanoff & Lehtinen (tulossa): Philosophy of game theory, Handbook for the philosophy of economics, toim. Uskali Mäki Ross, Don: game theory, Stanford encyclopedia of philosophy

Mitä on peliteoria? Strategisen vuorovaikutuksen tutkimiseen erikoistunut metodi. Miksi siitä pitäisi olla filosofina kiinnostunut?  Yhteiskuntatieteessä paljon käytetty metodi, joka perustuu tiettyihin metodologisiin taustaoletuksiin; esim. yksilöiden rationaalisuus (paitsi vrt. evolutionaarinen GT), henkilöiden välisiä hyötyvertailuita ei saa käyttää ym.)  Filosofisia kysymyksiä voi tarkastella peliteoreettisilla välineillä. Esim. vapaamatkustajaongelma, Newcombin ongelma ja kausaalinen päätöksenteon teoria, kooperaatio, koordinaatio, valtion oikeutus, sopimukset, normit jne.  Peliteorian perusteiden ymmärtäminen on välttämätöntä nykyaikaisen sopimusteorian ja ’kollektiivisen intentionaalisuuden’ ymmärtämiseksi (Rawls, Binmore, Skyrms, Young, Tuomela, Gilbert, Searle, Bratman, Pettit ym.)

Peruskäsitteitä Kooperatiivinen ja non-kooperatiivinen peliteoria Pelaajat (i,…,n) Palkkiot  ovat von Neumann-Morgenstern hyötyfunktioita. Strategiat (määrittävät tekoja kaikissa mahdollisissa pelin vaiheissa) (s1,…sn) Ratkaisukäsitteet (tasapainot)

Vangin dilemma (PD) Vanki 2 Ei tunnusta Tunnustaa Vanki 1 -1,-1 -9,0 0,-9 -6,-6

Vangin dilemma Molemmilla pelaajilla on dominoiva strategia tunnustaa  ennuste on (tunnusta,tunnusta) Mutta jos molemmat tunnustavat, lopputulos on molemmille huonompi kuin jos kumpikaan ei tunnusta. Ennuste on siis se, että Pareto-optimaalista vaihtoehtoa ei valita  Kooperaation ongelma: yleistys moneen pelaajaan, esim. yhteismaan ongelma

Sosiaaliset dilemmat Julkishyödykkeet (non-excludable, non-rival) ulkoisvaikutukset

Nash tasapaino Monissa peleissä pelaajilla ei ole dominoivia Nainen Baletti Nyrk-keily Mies 1,2 0,0 2,1 Monissa peleissä pelaajilla ei ole dominoivia strategioita. Esim ’sukupuolten taistelu’:

Nash tasapaino Strategiapari (ja sitä vastaavat palkkiot) on Nash tasapaino jos kummallakaan pelaajalla ei ole kannustinta muuttaa toimintaansa tasapainossa. Eli jos kumpikin olettaa toisen pelaavan tasapainostrategiansa mukaisesti, kannattaa pitäytyä tasapainossa. Useiden Nash tasapainojen ongelma

Informaatio peliteoriassa Common knowledge (CK) (Lewis 1969): Jokin asia P (palkkio, pelin rakenne, propositio ym.) on CK joss jokainen pelaaja tietää, että P ja jokainen tietää että P ja jokainen tietää että jokainen tietää että P… Yleensä pelin rakenteen oletetaan olevan CK.

Tulkintoja vangin dilemmalle Se on rakenne, joka löytyisi maailmasta, mutta jota emme tosiasiassa havaitse, koska on keksitty keino ’ratkaista’ vangin dilemma. Havaitsemme tämän keinon. Esim. valtio ei tarjoaisi julkishyödykkeitä, ellei tällaisten hyödykkeiden tarjonta vapailla markkinoilla olisi vangin dilemma. Se on rakenne, joka löytyy maailmasta ja joka aiheuttaa ongelmia, jotka pitäisi ratkaista, mutta joita ei ole ratkaistu. Esim. luonnon saastuttaminen etc.

Miten vangin dilemma ’ratkaistaan’ Toistetaan sitä Muutetaan PD joksikin muuksi peliksi tarjoamalla sopivia kannustimia. Pelin ratkaisemisella voi tarkoittaa kahta asiaa: Ratkaisukäsitteen soveltamista  non-kooperatiivinen lopputulema ennusteena Todellisen ongelmatilanteen ratkaisemista (peliteoriassa käsitellään näistä vain ensimmäistä)

Epäonnistuneita yrityksiä ratkaista PD Väitetään, että ihmiset jotenkin kuitenkin valitsisivat kooperatiivisen strategian vaikka olisivatkin vangin dilemma- tilanteessa: esim. Gauthierin ’suoraviivaiset’ vs. ’rajoitetut’ maksimoijat, we-mode. Väitetään, että jos ihmiset välittävät toisen pelaajan hyödystä, he pelaisivat tietyllä tavalla.  Päätös– ja peliteorian tärkein metodologinen periaate: hyötyfunktiot sisältävät aina kaikki mahdolliset tekijät, jotka voisivat motivoida pelaajia.  ongelmatilanteen rajoite: palkkioiden kanssa ei saa kikkailla.

Toistettu vangin dilemma Superpeli ja vaihepelit Diskonttauksen perusidea: pelaajat haluavat palkkionsa mieluummin nyt kuin myöhemmin. Alipelitäydellinen Nash-tasapaino (SPNE) 2 C D 1 3,3 1,4 4,1 2,2

Diskonttaus Diskonttoaste (discount rate) r = lisäosamäärä  -yksikköä, joka tarvitaan kompensoimaan sitä, että  saadaan yhtä periodia myöhemmin. (Jos  on ilmaistu rahana, r on sama kuin korkoaste: esim. 100 mk nyt kasvaa vuodessa 104 mk:ksi, jos korkoaste on 4 prosenttia; eli 100 mk vuoden päästä on 1/(1+0.04)*100 arvoinen nyt.) Diskonttotekijä (discount factor)  = 1/(1+r) = seuraavalla periodilla saatavan - yksikön arvo nykyisissä - yksiköissä, eli määrä, jolla tulevat palkkiot pitää diskontata, jotta saataisiin niiden nykyarvo. Syitä diskonttaukseen silloin, kun  ei ole rahamääräisesti ilmaistu: - puhdas aikapreferenssi (oikeastaan tämä on irrationaalista; Sidgwíck 1800-luvun lopussa) - epävarmuus siitä, jatkuuko peli vai ei: tn 1-, että nykyinen vaihepeli onkin viimeinen.

Diskonttaus it = pelaajan i palkkio periodilla t. Pelaajan i diskontattu kokonaispalkkio on i0 + i1 + i22 +...+ itt +... (merk. 1 +  + 2 +...+ t +...= .  + 2 +...+ t +...=   -  = 1, eli (1-)=1, eli  = 1/(1-) ) Jos kunkin vaihepelin palkkio on sama, , diskontattu palkkio on /(1-).

Toistettu vangin dilemma GRIM- strategia: valitse C niin kauan, kunnes toinen valitsee D. Tämän jälkeen valitse D ikuisesti. Onko GRIM vastaan GRIM SPNE? Kannattaako pelata C? 2 tapausta: a) jompikumpi on pelannut D. b) kumpikaan ei ole vielä pelannut D. a) Kummankaan ei kannata pelata C, jos toinen kerran pelaa D.  Jos jompikumpi pelaa D, molempien kannattaa pelata D koko loppupelin ajan. b) Palkkio C:n pelaamisesta on 3 + 3 + 32 + ... = 3/(1-), Palkkio D:n pelaamisesta on 4 + (1 +  + 2 + ...) = 4 + 1/(1-). Pysyttäytyminen GRIM- strategiassa kannattaa jos 3/(1-) > 4 + 1/(1-), eli jos  > ½.  GRIM vastaan GRIM on SPNE jos diskonttotekijä on riittävän suuri (tässä jos  > ½).

TFT: toinen liipasinstrategia Grim on liipasinstrategia: Aloitetaan kiltillä (nice) pelillä. Jos toinen valitsee halutun kiltin strategian, jatketaan sitä. Jos taas toinen ei pelaa kiltisti, (liipasin vapautuu) aloitetaan toisen rankaisu. TIT-FOR-TAT (TFT): Valitse ensin C, sen jälkeen periodilla (t) valitse se teko, jonka toinen pelaaja valitsi edellisellä periodilla (t-1). Axelrod (1984): TIT-FOR-TAT on järkevä strategia monissa olosuhteissa (nice, forgiving ja trigger). TIT-FOR-TAT on erityisen hyvä strategia silloin, kun pelataan useita erilaisia strategioita vastaan. Silti, se ei ole paras mahdollinen strategia kaikkia mahdollisia strategioita vastaan.

Folk teoreema Käytössykli (behavior cycle) on toistettu ketju tekoja: pelaajat pelaavat (esim.) (C, C) T1 kpl. vaihepeliä, sitten (D, D) T2 vaihepelin ajan, sitten (C, D) T3 vaihepelin ajan, sitten (D, C) T4 vaihepelin ajan jne. Folk teoreema: Mikä tahansa käytössykli on saavutettavissa alipelitäydellisenä tasapainona, jos diskonttotekijä on lähellä yhtä (  1). Folk teoreema sanoo, ettei ole mahdollista sanoa, miten pelaajat pelaisivat äärettömästi toistettua peliä. Ennustaminen on mahdotonta, koska alipelitäydellisiä tasapainoja on ääretön määrä. Teoreeman todistus perustuu intuitiivisesti järkevään ideaan: Voidaan aina löytää tapa rankaista toista pelaajaa, vaikka rankaiseminen rankaisee myös rankaisijaa itseänsä, koska tulevaisuuden palkkioilla on väliä jos diskonttotekijä on lähellä yhtä.

Yleisiä johtopäätöksiä toistetuista peleistä Äärellisesti ja äärettömästi toistettujen pelien ero on suuri. Axelrod, folk teoreema ym: Yhteistoimintaa (cooperation) voi syntyä ilman keskusvallan (esim. valtion) sekaantumista asioihin, jos pelaajat välittävät riittävästi tulevaisuudesta. Hyvän maineen rakentaminen kannattaa pitkällä aikavälillä.