Esittely latautuu. Ole hyvä ja odota

Esittely latautuu. Ole hyvä ja odota

Mekanismin suunnittelu

Samankaltaiset esitykset


Esitys aiheesta: "Mekanismin suunnittelu"— Esityksen transkriptio:

1 Mekanismin suunnittelu
MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly Aleksi NIemi The document can be stored and made available to the public on the open internet pages of Aalto University. All other rights are reserved.

2 Mitä on mekanismin suunnittelu?
Sosiaalisen valinnan teoria tutkii agenttien preferenssien järjestämistä suurimman kokonaishyödyn mukaisesti Sosiaalisen valinnan teoria on kuitenkin ei- strateginen: preferenssit oletetaan annetuiksi, vaikka agentit voivat saada hyötyä valehtelemalla preferensseistään Mekanismin suunnittelu yhdistää peliteorian ja sosiaalisen valinnan teorian. Suunnittelija etsii optimaalista tulosta agenttien aitojen preferenssien mukaan .

3 Esimerkki: taktinen äänestäminen
Aku Ankka ehdottaa veljenpojilleen ja heidän kaverilleen Lauri Lokille ajanvietteitä, vaihtoehdot ovat a = videopelihalli b = koripallo c = autoajelu Voittaja-aktiviteetti valitaan enemmistöäänestyksellä, tasatilanteessa ratkaisee aakkosjärjestys Tupu, Hupu ja Lupu ovat rehellisiä ja kertovat oikean preferenssinsä. Lauri Lokki sen sijaan on vähän laiska ja ovela siivekäs ja saattaa valehdella preferensseistään. Hän myös tietää ystäviensä valinnat ennen kuin päättää omastaan. Lauri Lokki äänestää vaihtoehtoa a, koska hänelle a ≻ b, jolloin a voittaa Pystytäänkö tällainen manipulointi estämään? PREFERENSSIT: Tupu: b ≻ a ≻ c Hupu: b ≻ a ≻ c Lupu: a ≻ b ≻ c Lauri Lokki: c ≻ a ≻ b

4 Mekanismin suunnittelu rajoittamattomilla preferensseillä
Koska yleensä oletetaan agenttien preferenssien olevan tuntemattomia, tutkitaan Bayesin pelejä Kertausta: Bayesin pelin määrittely tyypeillä on monikko (N, O, Θ, p, u), jossa N on äärellinen agenttien joukko O on lopputulemien joukko Θi on pelaajan i mahdollisten tyyppien joukko p on jakauma pelaajien tyypeille ui on pelaajan i hyötyfunktio Pelille voidaan määritellä mekanismi, joka on pari (A, M), jossa A = 𝐴 1 ×…× 𝐴 𝑛 , jossa 𝐴 𝑖 on agentin i mahdollisten toimintojen joukko 𝑀:𝐴→ (𝑂) kuvaa toimintaprofiileille lopputulemat

5 Toimeenpantavuus Dominoivat strategiat
Suunnittelijan tavoitteena on valita mekanismi, jonka johdosta Bayesin pelin tasapainoilla on toivottuja ominaisuuksia Määritelmä: Bayesin pelille (N, O, Θ, p, u) mekanismi (A, M) on dominoitujen strategioiden toimeenpano sosiaaliselle valintafunktiolle C, jos millekään hyötyfunktioista u pelillä on tasapaino dominoivissa strategioissa. Tällaiselle tasapainolle 𝑀( 𝑎 ∗ )=𝐶 𝑢 . Agenteilla ei ole dominoivien strategioiden tapauksessa tarvetta ottaa muiden strategioita huomioon maksimoidakseen oman hyötynsä Aku Ankka –esimerkin mekanismi on hyvin määritelty, mutta mekanismi ei toimeenpane sosiaalista valintafunktiota dominoivissa strategioissa Riittääkö heikompi määritelmä?

6 Toimeenpantavuus Bayesin Nashin tasapaino Määritelmä: Bayesin pelille (N, O, Θ, p, u) mekanismi (A, M) on Bayesin Nashin tasapainon toimeenpano sosiaaliselle valintafunktiolle C (yli N:n ja O:n), jos on olemassa Bayesin Nashin tasapaino, jolla jokaiselle 𝜃∈ Θ ja a ∈𝐴 𝑀(𝑎)=𝐶 𝑢(∙,𝜃) .

7 Paljastusperiaate (the revelation principle)
Mekanismeissa kaivattu periaate, todenmukaisuus, toteutuu kun agentit ilmoittavat aidot preferenssinsä pelin tasapainotilassa. Todenmukaisuus voidaan saavuttaa sosiaalisesta valintafunktiosta tai agenttien preferensseistä riippumatta. Määritelmä: Jos on olemassa mekanismi, joka toimeenpanee sosiaalisen valintafunktion C dominoiville strategioille, silloin on olemassa suora mekanismi, joka toimeenpanee C:n dominoiville strategioille ja on todenmukainen Rakennetaan vanhan mekanismin ympärille uusi mekanismi, joka pyytää agenttien hyötyfunktiot ja etsii niille optimistrategian Agenteilla ei ole insentiiviä valehdella hyötyfunktiostaan, koska silloin mekanismi ajaisi valheeseen perustuvan optimistrategian agentille

8 Yleisen dominoivien strategioiden toimeenpanon mahdottomuus
Paljastusperiaatteen johdosta voimme keskittyä vain totuudenmukaisiin mekanismeihin Mitkä sosiaalisen valinnan funktiot voidaan toimeenpanna dominoivissa strategioissa? Gibbard-Satterthwaiten teoreema (Muller-Satterthwaiten teoreeman korollaari): Oletetaan sosiaalisen valinnan funktio C. O ≥3 (ainakin 3 lopputulemaa) Jokaiselle 𝑜∈𝑂 on olemassa preferenssiprofiili [≻], jolle 𝐶([≻]) =𝑜 C on totuudenmukainen dominanteissa teorioissa → C on diktatorinen (a) Ratkaisu löytyy, (b) algoritmi näyttää että ongelmalla ei ole ratkaisua, (c) algoritmi pysähtyy, mutta ei kykene näyttämään, että ongelmalla ei ole ratkaisua, (d) algoritmi ei pysähdy, eikä kykene näyttämään että ongelmalla ei ole ratkaisua

9 Kvasilineaariset preferenssit
Muodostaaksemme dominoiville strategioille totuudenmukaisen mekanismin, joka ei ole diktatorinen, pitää löyhentää edellä mainittuja kriteereitä. Rajoitetaan hyötyfunktiota kvasilineaarisiin tapauksiin: 𝑢 𝑜,𝜃 = 𝑢 𝑖 𝑥,𝜃 − 𝑓 𝑖 (𝑝 𝑖 ), jossa 𝑜=(𝑥,𝑝) on O:n alkio, 𝑢 𝑖 mielivaltainen funktio ja 𝑓 𝑖 aidosti monotonisesti kasvava funktio. Hajotetaan hyötyfunktio kahteen osaan: 𝑋 on äärellinen joukko ei-rahallisia lopputulemia, kuten esim. kohteen allokointi yhdelle tarjoajalle huutokaupassa tai ehdokkaan valinta vaaleihin. 𝑝 𝑖 on (mahdollisesti negatiivinen) agentin tekemä maksu mekanismille. Mekanismi voi siis laskuttaa tai palkita tietyistä valinnoista. Agenttien hyöty ei riipu hänen rahamäärästään vaan vain valintojen hyödyistä ja heidän omista maksuistaan (ei muiden maksuista) (a) Ratkaisu löytyy, (b) algoritmi näyttää että ongelmalla ei ole ratkaisua, (c) algoritmi pysähtyy, mutta ei kykene näyttämään, että ongelmalla ei ole ratkaisua, (d) algoritmi ei pysähdy, eikä kykene näyttämään että ongelmalla ei ole ratkaisua

10 Riskiasenteet Entäs edellä määritetyt funktiot 𝑓 𝑖 ?
Enemmän rahaa tarkoittaa enemmän hyötyä – mutta onko suhde lineaarinen vai jotain muuta? Yleensä ihmiset arvioivat yhden lisärahayksikön tuottamaa marginaalista hyötyä pienemmäksi, mitä enemmän heillä on jo rahaa – tätä kutsutaan riskiaversioksi. Pienillä rahamäärillä voi esiintyä riskihakuisuutta, esim. lottoaminen. Riskiasenne voi siis vaihdella eri kohdissa rahakäyrää. Usein oletetaan joko riskineutraalius tai riskiaversio (kuten esim. Markowitzin portfolioteoriassa). Riskineutraalius tekee laskelmista yksinkertaisempia matemaattisesti. Oletuksia on vaikea perustella johdonmukaisesti. Oletamme, että hyöty-raha-käyrä on lineaarinen ja 𝑓 𝑖 𝑝 =𝛽𝑝, 𝛽∈ 𝑅 Täten voimme kutsua sitä siirrettäväksi hyödyksi, koska riippumatta ei-rahallisesta valinnasta 𝑥∈X rahaa siirrettäessä agentilta toiselle, myös hyötyä siirtyy sama määrä.

11 Mekanismin suunnittelu kvasilineaarisessa mallissa
Mekanismi Bayesin pelille, jossa 𝑂=𝑋× 𝑅 𝑛 kvasilineaarisessa mallissa on kolmikko (𝐴,𝑋,𝜌), jossa A = 𝐴 1 ×…× 𝐴 𝑛 , jossa 𝐴 𝑖 on agentin i mahdollisten toimintojen joukko 𝑋:𝐴→ (𝑋) kuvaa joka toimintaprofiilin valintajakaumaan 𝜌:𝐴→ 𝑅 𝑛 kuvaa joka toimintaprofiilin maksujakaumaan Jaamme siis funktion M valinta- ja maksusääntöön. Suorassa paljastusmekanismissa agenttia pyydetään ilmoittamaan tyyppinsä.

12 Suora kvasilineaarinen mekanismi
Kolmikon sijaan pari 𝑋,𝜌 , 𝐴 𝑖 =Θi. Oletus, että agenttien hyödyt riippuvat vain niiden tyypistä. Tätä kutsutaan ehdolliseksi hyötyriippumattomuudeksi. Ehdollinen hyötyriippumattomuus Kaikille agenteille i, kaikille lopputulemille o, kaikille tyypeille 𝜃 ja 𝜃′ ∈ Θ pätee 𝑢 𝑖 (𝑜,𝜃)= 𝑢 𝑖 𝑜, 𝜃 ′ Voimme viitata agentin arvostukseen valinnalle 𝑥∈𝑋 kirjoittamalla 𝑣 𝑖 𝑥 = 𝑢 𝑖 𝑥,𝜃 . Kvasilineaarisen mekanismin totuudenmukaisuus Toteutuu jos agentin ilmoittama arvostus 𝑣 𝑖 = 𝑣 𝑖 eli hänen aito arvostuksensa.

13 Tehokkuus Budjettitasapaino
Kvasilineaarinen mekanismi on Pareto-tehokas, jos tasapainossa se valitsee 𝑥:n, jolla ∀𝑣∀ 𝑥 ′ , 𝑖 𝑣 𝑖 (𝑥)≥ 𝑖 𝑣 𝑖 ( 𝑥 ′ ) Tarkoittaa agenttien saaman hyödyn summan maksimointia Budjettitasapaino ∀𝑣 𝑖 𝜌 𝑖 𝑠 𝑣 =0 , jossa s on tasapainostrategiaprofiili Tarkoittaa, että agenttien tyypeistä riippumatta mekanismi kerää ja antaa rahaa agenteille saman verran, eli se ei tee voittoa tai tappiota

14 Grovesin mekanismit Tehokkuutta pidetään yhtenä tärkeimmistä ominaisuuksista kvasilineaarisessa mallissa. Grovesin mekanismit ovat tehokkaita suoria kvasilineaarisia mekanismeja Niille pätee 𝑋 𝑣 = arg 𝑥 max 𝑖 𝑣 𝑖 (𝑥) 𝜌 𝑖 ( 𝑣 )= ℎ 𝑖 𝑣 −𝑖 − 𝑗≠𝑖 𝑣 𝑗 (𝑋( 𝑣 )) Agentit voivat siis ilmoittaa minkä tahansa arvostuksen 𝑣 , jolloin mekanismi optimoi valinnan olettaen että annetut funktiot ovat aitoja. Agentin täytyy maksaa mielivaltainen määrä ℎ 𝑖 𝑣 −𝑖 , mikä ei riipu hänen omasta ilmoituksestaan ja hänelle maksetaan kaikkien muiden agenttien ilmoittama arvostusvalinnat. Koska suunnittelija voi valita hinnat ℎ 𝑖 vapaasti, puhutaan Grovesin mekanismien perheestä.

15 Terminologia Mekanismi = järjestelmä, joka säännönmukaisesti aiheuttaa valinnoille tietyn seurauksen Mekanismin suunnittelu = yritys löytää tai kehittää järjestelmä, joka ohjaa valintoja sosiaalisen hyödyn maksimoimiseksi Sosiaalisen valinnan teoria = tutkii mielipiteiden, preferenssien, intressien yhdistämistä kollektiiviseksi valinnaksi Sosiaalinen valintafunktio = funktio, joka yhdistää agenttien valinnat kollektiiviseksi valinnaksi Dominoiva strategia = strategia, josta ei kannata poiketa Bayesin Nashin tasapaino = strategiaprofiili, joka maksimoi hyödyn tehden oletuksen muiden pelaajien tyypeistä Todenmukaisuus (truthfulness) = agentit ilmoittavat aidot preferenssinsä pelin tasapainotilassa Diktatorinen = yksittäisen agentin preferenssit määrittävät sosiaalisen järjestyksen aina Riskiasenne = suhtautuminen hyödyn tai haitan epävarmuuteen Kvasilineaarinen funktio = funktio, joka on lineaarinen tietyn muuttujan suhteen

16 Kotitehtävä Tarkastellaan alun Aku Ankka –esimerkkiä. Sanallinen kuvailu riittää. a) Mikä on esimerkin sosiaalinen valintafunktio? b) Mikä on esimerkin mekanismi? c) Miten Aku voisi hyödyntää paljastusperiaatetta pelissään?


Lataa ppt "Mekanismin suunnittelu"

Samankaltaiset esitykset


Iklan oleh Google