Esittely latautuu. Ole hyvä ja odota

Esittely latautuu. Ole hyvä ja odota

Y56 Luku 29 Peliteoria Varian 2006, luku 28.

Samankaltaiset esitykset


Esitys aiheesta: "Y56 Luku 29 Peliteoria Varian 2006, luku 28."— Esityksen transkriptio:

1 Y56 Luku 29 Peliteoria Varian 2006, luku 28

2 Peliteoria on tapa mallintaa taloudenpitäjien strategista käyttäytymistä
Pelissä pelaajat tekevät strategisia päätöksiä omasta toiminnastaan Kukin pelaaja valitsee sellaisen strategian, joka maksimoi pelaajan oman hyödyn Pelaaja ottaa huomioon kaikki ne tavat, joilla muut taloudenpitäjät saattaisivat reagoida hänen valintoihinsa Esim. viime luennolla käsitellyt Cournot- ja Stackelberg-duopolimallit ovat esimerkkejä strategisista peleistä Pelissä kummankin yrityksen optimivalinta riippuu siitä, mitä se olettaa toisen yrityksen tekevän Pelaajat, siis yritykset, valitsivat tuotantomääränsä maksimoimalla omia voittojaan ottaen huomioon kilpailevan yrityksen valinnan

3 Peliteorialla analysoidaan muun muassa
Oligopoleja ja kartelleja Tuotantomäärät, kannustimet huijata kartellissa Ulkoisvaikutuksia esim. kalastuksessa ja kalastuspolitiikassa Ylikalastus, maiden väliset sopimukset Julkishyödykkeiden tarjontaa Kuka osallistuu rahoitukseen? Maanpuolustusstrategioita Erilaisia neuvottelutilanteita

4 Peliteorian peruskäsitteet ja sanastoa (1)
Pelaajat Pelaajia voi olla useita, mutta me tarkastelemme tässä kahden pelaajan pelejä Pelin säännöt kuka valitsee missäkin tilanteessa ja mitä informaatiota pelaajilla on Pelaajien strategiat tai päätössäännöt eli kuvaus siitä, miten pelaaja toimii kaikissa mahdollisissa tilanteissa mukaan lukien sellaiset tilanteet, joihin ei pelin aikana lopulta päädytäkään Kunkin pelaajan saama tuotto (hyöty, payoff) jokaisesta mahdollisesta valinnasta  Peliteoriassa oletetaan, että pelaajat tuntevat ja ymmärtävät pelin rakenteen Kaikilla pelaajilla ei kuitenkaan välttämättä ole samaa tietoa (ts. pelaajilla voi olla epäsymmetristä informaatiota)

5 Peliteorian peruskäsitteet ja sanastoa (2)
Staattiset pelit: kaikki pelaajat valitsevat vain kerran ja yhtä aikaa.  Dynaamiset pelit: pelaajat tekevät valintoja peräkkäin ja/tai pelaavat staattista peliä useita kierroksia (toistettu peli).  Yhteistyöpelit (cooperative games): yhteistyöpeleissä pelaajat voivat tehdä sitovia sopimuksia (binding commitments) Kilpailulliset pelit (noncooperative games): sitovat sopimukset eivät ole mahdollisia Nollasummapelit: nollasummapeleissä jaettavissa oleva kokonaistuotto summautuu aina nollaan riippumatta pelaajien valitsemista strategioista. Pelaajat voivat siis hyötyä vain muiden kustannuksella.

6 Pelimatriisi Kun pelaajat toimivat yhtäaikaisesti tai tietämättä toistensa valinnoista, peli voidaan esittää normaalimuodossa (myös kutsuttu strategiseksi muodoksi) Normaalimuotoinen peli esitetään payoff-matriisin avulla Payoff-matriisi eli hyötymatriisi kertoo pelaajat, pelaajien mahdolliset toiminnot sekä pelaajien hyödyt

7 Palautetaan mieleen Y55-kurssilla käsitelty Vangin dilemma
Käsitellään peli normaalimuodossa Esimerkki 1 Vangin dilemmassa pelaajat päätyvät Nash-tasapainoon Yleisemmin vangin dilemma kuvaa yhteistyön vaikeutta muissakin tilanteissa, joissa yhteistyö hyödyttäisi kumpaakin pelaajaa

8 Nash-tasapaino Nash-tasapaino: Nash-tasapainossa kaikki pelaajat valitsevat strategian, joka on paras mahdollinen, annettuna strategiat, joita muut pelaajat valitsevat. Ts. Nash-tasapainopiste on strategiapari, josta kummankaan pelaajan ei kannata yksinään poiketa. Nash-tasapainon/tasapainojen määrittelemiseksi oletetaan, että kukin pelaaja pelaa parhaan strategiansa mukaisesti. Pelissä voi olla useita Nash-tasapainoja tai voi olla niin, että pelissä ei ole ollenkaan tasapainoa siinä muodossa, kun me pelejä tarkastelemme (jätämme ns. sekastrategiat käsittelemättä)

9 Nash-tasapaino Hollywoodin tyyliin
Nash-tasapaino (1950) on saanut nimensä formuloijansa yhdysvaltalaisen matemaatikon ja talousnobelisti John Forbes Nash Jr:n mukaan (s. 1928). Nash tasapainon tulkinta elokuvassa Kaunis mieli (A Beautiful Mind) Nash-tp 1950 Tenure vee Princeton Skitsofrenia 58 Nobel 1994 kahden muun peliteorian kehittäjän kanssa (Reinhard Selten, John Harsanyi). Paluu

10 Dominoiva strategia Dominoiva strategia on strategia, joka on pelaajalle paras riippumatta siitä, mitä muut pelaajat tekevät Jonkin toiminnon valinta osoittautuu pelaajan kannalta kannattavimmaksi ilman, että tarvitsee edes huomioida vastapuolen käyttäytymistä Jos pelissä kaikilla pelaajilla on dominoiva strategia , niin pelissä on dominoivien strategioiden tasapaino strategioiden kombinaatio, joka koostuu kunkin pelaajan dominoivasta strategiasta

11 Vangin dilemma on myös esimerkki pelistä, jossa on dominoivien strategioiden tasapaino
Vangin dilemman tyyppisiä tilanteita esiintyy usein taloudessa Esimerkiksi viime luennolla käsiteltyä kartellia ja kannustinta huijata toista sopimusosapuolta voidaan tarkastella samassa kehikossa Tutkitaan nyt tilannetta, jossa päätös kartellisopimuksessa pitäytymisessä tehdään vain kerran Toisin sanoen kartellipeli pelataan vain kerran ja molemmat yritykset tietävät sen Hyödynnetään luvussa 28 esitettyä laskuesimerkkiä pelin matriisia laadittaessa Matriisin tuotot ovat tässä tapauksessa kunkin yrityksen saamat voitot eri tilanteissa Esimerkki 2

12 Yritysten tuotantomäärät ja voitot eri tilanteissa
Cournot Kartelli "Huijaus" yritys 1 voitto 46,1 48 50 tuotanto 4,8 4 5 yritys 2 44 Nähdään, että huijaaminen on kannattavaa: 50 > 48 Mutta toinen osapuoli kärsii: 44 < 48

13 Aktivoiva tehtävä 1, s.5 Tutki alla olevan mainontapelin matriisia ja kerro a) Mikä tai mitkä ovat pelin mahdolliset tasapainot? b) Onko pelillä dominoivien strategioiden tasapainoa?

14 Aktivoiva tehtävä 2, s.7 Tutki nyt alla olevan mainontapelin matriisia (tuotot eroavat edellisestä tilanteesta) ja kerro a) Mikä tai mitkä ovat pelin mahdolliset tasapainot? b) Onko pelillä dominoivien strategioiden tasapainoa?

15 Pelit, joissa ei ole dominoivien strategioiden tasapainoa
Näimme, että vangin dilemmassa on dominoivien strategioiden tasapaino (C,C), kun peliä pelataan kerran Kyseessä on siis paras valinta kummallekin pelaajalle riippumatta siitä, mitä toinen pelaaja valitsee. Kaikilla peleillä ei ole dominoivien strategioiden tasapainoa Tällaisissa peleissä voi kuitenkin olla ns. Nash-tasapaino (huom. kaikissa peleissä ei välttämättä ole ollenkaan tasapainoa Muistetaan, että Nash-tasapainossa kaikki pelaajat valitsevat strategian, joka on paras mahdollinen, annettuna strategiat, joita muut pelaajat valitsevat Ts. Nash-tasapainopiste on strategiapari, josta kummankaan pelaajan ei kannata yksinään poiketa. Yhdessä pelissä Nash-tasapainoja voi olla useita.

16 Aktivoiva tehtävä 3 Oletetaan, että muromarkkinoilla vallitsee duopoli. Molemmat yritykset harkitsevat uuden aamiaismuron lanseeraamista markkinoille. Markkinatutkimukset osoittavat, että markkinoilla on tilaa sekä yhdelle uudelle rapealle murolle että yhdelle uudelle makealle murolle. Oletetaan, että valinta tapahtuu samanaikaisesti ja että yrityksillä ei ole mahdollisuutta koordinoida lanseerattavan murotyypin valintaa. Oletetaan myös, että kummallakin yrityksellä on resursseja vain yhden uuden murotyypin tuottamiseen ja markkinointiin.

17 Aktivoiva tehtävä 3 jatkuu
Alla oleva matriisi havainnollistaa yritysten tuotot. Mikä on ns. normaalipelin Nash-tasapaino?

18 Dynaamiset pelit Edellä tarkastelimme staattisia pelejä, joissa valinta tehdään vain kerran ja vielä samanaikaisesti Dynaamisia pelejä on kahdenlaisia pelaajat tekevät valintoja peräkkäin Ja/tai pelaajat pelaavat staattista peliä useita kierroksia Jälkimmäisestä käytetään nimitystä Repeated game

19 Toistuvat pelit (repeated game)
Peli, jossa staattista yhden kierroksen peliä toistetaan monta kertaa Luvussa 28 tutkittiin, olisiko yritysten muodostama kartelli stabiili, kun yritykset voivat pelata kartellipeliä loputtomia kertoja (siis äärettömän määrän kierroksia) Oletettiin, että jos yritys 1 huijaa toista yritystä, huijaamisen jälkeen toinen yritys ei enää suostu kartellitoimintaan, vaan pelaa tästä eteenpäin Cournot-peliä. Luvussa laskettiin, millä voitot nykyarvoistavalla koron tasolla kartelli olisi stabiili. Tutkitaan nyt tilannetta, jossa kartellipeliä pelataan toistuvasti, mutta kierroksia on äärellinen määrä. Oletetaan, että kierroksia on 10 ja pelaajat tietävät tämän.

20 Onko kartelli stabiili 10 kierroksen tapauksessa, eli onko yhteistyötä mahdollista ylläpitää?
Edellä näimme staattisia pelejä tarkastellessamme, että yhden kierroksen tapauksessa Nash-tasapaino ei ole kartellia ylläpitävä, vaan tasapaino oli matriisin solussa (C,C). Luvussa 28 taas näimme, että äärettömällä määrällä kierroksia kartellisopimus voi olla pysyvä, jos koron taso on laskemamme. Mitä jos nyt valitaan vaihtoehto näiden ääripäiden eli yhden ja äärettömän kierrosmäärän väliltä?

21 Yritys voi esim. valita seuraavan strategian
Valitse kartellin tuotantomäärä y = 4 niin kauan kuin toinenkin valitsee samoin Jos toinen poikkeaa kartellisopimuksen mukaisesta tuotantomäärästä ja valitsee suuremman tuotantomäärän y’= 5 jollakin kierroksella, pelaa jokaisella kierroksella siitä eteenpäin Cournot-peliä, jolla y = 4.8. Voiko tilanne, että kumpikin yritys toteuttaa tällaista strategiaa olla tasapaino?

22 Toistettu peli ratkaistaan nyt lopusta alkuun päin (backwards induction)
Mietitään ensin, mitä kummankin yrityksen kannattaa tehdä (siis tuottaa) viimeisellä kierroksella 10. Viimeisellä kierroksella tämä toistettu peli näyttää tismalleen samalta kuin yhden periodin staattinen peli edellä. Yrityksillä on siis dominoiva strategia (C,C), jolloin valitaan tuotantomäärät (y’,y’) Toiseksi viimeisellä periodilla pelaajat tietävät, että kierroksella 10 kannattaa joka tapauksessa pelata (C,C) eli valita tuotantomäärät (y’,y’). Tästä seuraa, että 9. kierroksella kannattaa myös valita tuotantomääräksi y’. Kun jatketaan samalla tavalla, todetaan, että jokaisella kierroksella kannattaa valita (C,C) eli (y’,y’).

23 Äärellisen pelin Nash-tasapaino on aina (C,C), vaikka peliä pelattaisiin satoja tai tuhansia kierroksia Nash-tasapaino pysyy yllä, kunhan vaan kierrosten määrä on äärellinen Toisin sanoen pelin loppu on siis tiedossa (esim. T=1000) Peliteoria siis ennustaa, että kartellisopimusta ei noudateta, ellei peliä pelata äärettömiä määriä kierroksia ja ellei korkokanta, jolla yritykset nykyarvoistavat tulevat tulonsa ole sopiva. Kun kierrosten määrä on ääretön, pelissä on useita Nash-tasapainoja esim. korkokannasta riippuen.

24 Mitä, jos kierrosten määrä on äärellinen, mutta ei kuitenkaan pelaajien tiedossa (T=?) ?
Todellisuudessa pelaajat eivät yleensä tiedä, kuinka monta kierrosta he tulevat pelaamaan. Kartellin solmineet osapuolet eivät siis ole tietoisia siitä, kuinka kauan he toistavat päätöksen kartellissa pysymisestä tai huijaamisesta. Jos kierrosten määrä on tuntematon, voi olla mahdollista pitää yllä yhteistyötä kartellipelissä. Tällöin tarvitaan kuitenkin uskottava uhkaus huijaamista seuraavasta sanktiosta Pelaajien on siis todella uskottava, että huijaamista seuraa sanktio

25 Tit-for-tat strategia toteuttaa tällaisen uskottavan uhkauksen, joka voi pitää kartellitasapainoa voimassa, vaikka T olisi tuntematon Robert Axelrod pyysi vuonna 1984 peliteorian tutkijoita ehdottamaan, mikä olisi paras strategia, kun vangin dilemman tyyppisiä pelejä pelataan äärettömiä kierroksia. Axelrod pelautti tietokoneella kaikkia mahdollisia tarjottuja strategioita toisiaan vastaaan Tietokonesimulaatio osoitti, mikä strategia tuottaisi pelaajalle suurimman tuoton. Voittaja oli varsin yksinkertainen stragia: ns. tit-for-tat -strategia (kirjaimellisesti potut pottuina -strategia)

26 Tit-for-tat strategia hinnoittelupelissä:
Aloita peli valitsemalla korkea hinta  Jos jollakin kierroksella toinen pelaaja valitsee matalan hinnan valitse sitten matala hinta ja jatka matalan hinnan valitsemista seuraavissakin peleissä siihen asti kunnes toinen pelaaja valitse jälleen korkean hinnan  Sen jälkeen valitse korkea hinta siihen asti kunnes toinen pelaaja taas mahdollisesti poikkeaa tästä strategiasta.

27 Dynaamiset pelit, joissa valinta tehdään peräkkäin
Katsotaan seuraavaksi pelejä, joissa jommallakummalla pelaajalla on etulyöntiasema Muistathan Stackelberg-duopolimallin viime luennolta Pelissä oli Johtaja ja Seuraaja Dynaamiset pelit esitetään yleensä ns. ekstensiivisessä muodossa Puhutaan myös pelipuumuodosta

28 Miten tämä muropeli (jonka tuottoja on muutettu) esitettäisiin ekstensiivisessä muodossa?
Oletetaan nyt, että yritys 1 on Johtaja ja yritys 2 on Seuraaja

29 Onko Seuraajalla mitään mahdollisuuksia vaikuttaa tilanteeseen?
Seuraajahan saisi isommat voitot, jos se pystyisi sitoutumaan Sweet-muron tuotantoon Jos Johtaja uskoo varmasti, että Seuraaja tuottaa Sweet, niin sen kannattaa valita Crispy

30 Seuraaja voi ennakolta sitoutua Sweet-muron tuottamiseen
Tällaisen ratkaisun syntymisessä avainasemassa on Seuraajan sitoutumisen uskottavuus Toisin sanoen, onko Seuraajan uhkaus uskottava Sitoutumiskeinoja voisivat olla esimerkiksi kalliin mainoskampanjan toteuttaminen, jossa mainostetaan tulevaa Sweet-muroa tai suuren tuotantopanosmäärän (esim. sokerin) ostaminen Uhkauksen pitää olla kilpailijan havaittavissa ja toiminnan pitää olla uskottavan kallis Jos Seuraajan uhkaus on uskottava, niin Johtajan ei kannata lanseerata Sweet-muroa markkinoille, vaikka se pystyykin tekemään sen ensimmäisenä koska vaihtoehto (Sweet, Sweet) tuottaa kummallekin yritykselle tappiota

31 Aktivoiva tehtävä 6, s. 18 Kahden yrityksen välinen dynaaminen peli on kuvattu alla. Oletetaan yritys 2 on nyt johtaja. Kuvittele, että yritys 1 uhkaa valita matalan hinnan, jos yritys 2 valitse matalan hinnan. Onko sen uhkaus uskottava? Perustele.

32 Uskottavien uhkauksien tekemisessä pelaajan maineella voi olla ratkaiseva rooli
Esimerkiksi pelaaja, jota pidetään vähän hulluna, voi saada pelissä etua esimerkiksi sillä, että sen voidaan uskoa toteuttavan sellainen uhkaus, joka ei ole pelaajalle itselleen (ainakaan lyhyellä aikavälillä) kannattava. Pelaaja voi pelata muutaman kierroksen peliä ”hulluna” (siis epärationaalisesti), jos tällainen lyhyen aikavälin strategia antaa sille edun pitkällä aikavälillä. Kertaluontoisessa pelissä, kuten aktivoivassa tehtävässä edellä, hullun strategia ei kuitenkaan olisi toimiva.

33 Oppimistavoitteet luennon asioista
Osaat muodostaa annetuista tiedoista pelin normaalimuodon ja ratkaista tasapainon Osaat määritellä (ja tarkastaa onko pelissä sellaisia) Dominoivan strategian Dominoivien strategioiden tasapainon Nash-tasapainon Erotat kaksi eri tyyppistä dynaamista peliä toisistaan Osaat muodostaa peräkkäisen dynaamisen pelin ekstensiivisen muodon ja ratkaista sen lopusta alkuun Ymmärrät, miksi äärettömässä pelissä, jossa loppu T on tunnettu, tasapaino on sama kuin pelattaisiin yhden kierroksen staattinen peli Osaat määritellä ja tarkistaa, onko toisen pelaajan uhkaus sitova


Lataa ppt "Y56 Luku 29 Peliteoria Varian 2006, luku 28."

Samankaltaiset esitykset


Iklan oleh Google