Esittely latautuu. Ole hyvä ja odota

Esittely latautuu. Ole hyvä ja odota

Pelien normaalimuoto & Nashin tasapaino Juhani Sipilä The document can be stored and made available to the public on the open internet pages.

Samankaltaiset esitykset


Esitys aiheesta: "Pelien normaalimuoto & Nashin tasapaino Juhani Sipilä The document can be stored and made available to the public on the open internet pages."— Esityksen transkriptio:

1 Pelien normaalimuoto & Nashin tasapaino 28.9.2016 Juhani Sipilä The document can be stored and made available to the public on the open internet pages of Aalto University. All other rights are reserved. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

2 Pelien normaalimuoto. Agenteilla on aina hyötyfunktio jonka odotusarvoa ne koittavat maksimoida. Epävarmassa ympäristössä toimiminen suoraviivaista (oletuksella, että lopputulemat ja niiden todennäköisyydet ovat agentin tiedossa). Useamman omaa hyötyään maksimoivan agentin tapauksessa tilanne voi muodostua huomattavasti monimutkaisemmaksi. Peliteoria tarjoaa tällaisten tilanteiden (pelien) analysoimiseen ja ymmärtämiseen matemaattisen viitekehyksen

3

4 Vaikuttaako vangin strategiaan mitä hän kuvittelee toisen tekevän? Käyttäytyvätkö mitkä tahansa kaksi vankia samalla tavalla pelatessaan tätä peliä? Muuttuuko vankien strategia jos he saavat neuvotella ennen päätöksiään? Millaiset muutokset tuomiovuosien pituuksiin pitäisivät vankien toiminnan muuttumattomana? Miten samat vangit käyttäytyisivät jos he joutuisivat samaan tilanteeseen useammin kuin kerran? Vaikuttaako näihin kysymyksiin vankien (agenttien) rationaalisuus ja se miten he näkevät toistensa rationaalisuuden? Vankien dilemma (1/2) B: VasikoiB: Hiljaa A: VasikoiA:-5 B:-5A:0 B:-20 A: HiljaaA:-20 B:0A:-1 B:-1

5 Peliteorian mukaan rationaalinen vanki, jolle peli esitetään kerran, vasikoi aina toisen vangin. Riippumatta toisen käyttäytymisestä! Vankien keskinäinen neuvottelu ennen peliä ei muuta käyttäytymistä. Täydellisen rationaalisilla vangeilla tulos ei muutu vaikka he pelaisivat peliä useamman kerran! Jos peliä pelataan äärettömän monta kertaa tai kierroksia on tuntematon määrä, saattavat (rationaaliset) pelaajat valita myös yhteisen hiljaisuuden-strategian Pelin yleisessä muodossa c > a > d > b Vankien dilemma (2/2) B: VasikoiB: Hiljaa A: VasikoiA:-5 B:-5A:0 B:-20 A: HiljaaA:-20 B:0A:-1 B:-1 B: VasikoiB: Hiljaa A: VasikoiA: d B: dA: c B: b A: HiljaaA: b B: cA: a B: a

6 Pelien normaalimuodon määritelmä

7 SuolahappoAmmoniakki Suolahappo-1,-11,1 Ammoniakki1,1-1,-1 Salmiakki-koordinointi peli KPS K0,0-1,11,-1 P 0,0-1,1 S 1,-10,0 KPS peli

8 Strategiat normaalimuodon peleissä (1/2)

9 Strategiat normaalimuodon peleissä (2/2)

10 Pelien analysointi – Optimista tasapainoon Yksi agentti –Optimistrategia: strategia joka maksimoi agentin odotusarvoisen hyödyn peliympäristössä. –Peliympäristö (luonto) saattaa olla stokastinen, osittain havainnoitava ja yllätyksiä täynnä. Useampi agentti –Peliympäristö vaikeutuu olennaisesti muiden agenttien läsnäolosta / toiminnoista. –Kaikki koittavat maksimoida omaa hyötyään. –Yksittäisen agentin optimistrategia agentille i ei ole enää mielekäs, sillä nyt optimistrategiaan vaikuttaa muiden agenttien päätökset / toiminnat. –Ongelma voidaan peliteoriassa välttää tutkimalla tiettyjen lopputulemien osajoukkoja, joita kutsutaan ratkaisu konsepteiksi (solution concept), jotka ovat jollakin tapaa mielenkiintoisia. –Tärkeimpinä Pareto-optimaalisuus ja Nashin tasapaino.

11 Pareto-optimaalisuus (1/3) Voiko ulkopuolisen tarkastelijan näkökulmasta havaita jotkut lopputulemat paremmiksi kuin toiset? Tarvitaan metodi, jonka avulla voidaan määrittää jotkut lopputulemat toisia paremmiksi kun agenttien hyötyfunktiot tunnetaan (positiiviseen affiini- transformaatioon asti). Esim. Tuntematta iridiumin (I) ja palladiumin (P) markkinahintoja on selvää, että 10 I harkkoa ja 7 P harkkoa on mieluisampi vaihtoehto kuin 9 I harkkoa ja 7 P harkkoa!

12 Pareto-optimaalisuus (2/3)

13 Pareto-optimaalisuus (3/3) Pareto-optimaalisuus: Strategiaprofiili s on Pareto-optimaalinen tai vahvasti Pareto tehokas (strict Pareto efficiency) jos ei ole olemassa toista strategiaprofiilia s’ joka Pareto dominoi s:ää. Jokaisella pelillä täytyy olla vähintään yksi Pareto-optimi ja aina vähintään yksi P.-optimi, jossa kaikki pelaajat valitsevat puhtaat strategiat. Jotkut pelit sisältävät useita Pareto-optimeita Nollasumma-peleissä kaikki strategiaprofiilit vahvasti Pareto tehokkaita. Yhteisen hyödyn peleissä kaikilla Pareto- optimaalisilla strategiaprofiileilla samat hyödyt.

14 Paras vaste

15 Nashin tasapaino

16 Nashin tasapainon löytäminen (1/2) Tarkastellaan sukupuolten taisto-peliä (battle of the sexes game) –Kaksi puhdasta Nashin tasapainoa löytyy helposti. Tasapainojen oikeellisuuden tarkastaminen helppoa: jos toinen pelaa (puhdasta) strategiaansa, toinen voi vain hävitä muuttamalla omaa strategiaansa. Ovatko nämä pelin ainoat Nashin tasapainot? BalettiLAN Baletti2,10,0 LAN0,01,2

17 Nashin tasapainon löytäminen (2/2) BalettiLAN Baletti2,10,0 LAN0,01,2

18 Nashin tasapainojen olemassaolo (1/3)

19 Nashin tasapainojen olemassaolo (2/3)

20 Nashin tasapainojen olemassaolo (3/3) Nash (1951) Jokaisella pelillä, jossa on äärellinen määrä pelaajia ja äärelliset määrät toimintoja, on olemassa vähintään yksi Nashin tasapaino.

21 Kotitehtävät 1.Täsmäämättömät pennoset Ari (A) ja Bea (B) pelaavat peliä, jossa molemmat saavat valita kumman puolen omasta pennistään haluavat ylöspäin, kruunan vai klaavan. Valittuaan kolikkonsa tilan, he näyttävät valintansa toiselle saman aikaisesti ja lopuksi määritetään kuka voitti. Jos kolikkojen valitut puolet ovat eriävät, saa B pitää molemmat kolikot. Jos taas molemmat kolikot ovat klaava ylöspäin saa A pitää molemmat kolikot. Jos molemmat kolikot ovat kruuna ylöspäin saa A pitää molemmat kolikot ja saa vielä ylimääräiset 5 penniä höperöltä mummoltaan, joka taikauskoaan suosii tupla kruunia. -Määritä pelin normaalimuotoinen matriisi -Ratkaise pelin Nashin tasapaino


Lataa ppt "Pelien normaalimuoto & Nashin tasapaino Juhani Sipilä The document can be stored and made available to the public on the open internet pages."

Samankaltaiset esitykset


Iklan oleh Google