Kako je teorija igara dala krila blokčejn tehnologiji
U oskarom okićenom filmu Blistavi um jedna scena se naročito izdvaja. Grupa od pet momaka-studenata Prinstona pokušava da dopre do brojčano srazmerne grupe devojaka. Momci su više spetljani gikovi nego srcelomci, ali su svi zagledani u plavušu koja se lepotom izdvaja od ostalih devojaka. Pitaju se ko ima najviše šanse kod nje.
U toj sceni jedan od momaka citira Adama Smita: “Kada se takmičimo, pojedinačne ambicije služe opštem dobru.” Džon Neš, najsramežljiviji i najspetljaniji od svih, doživljava prosvetljenje. “Smit nije u pravu, njegovo učenje je nedovršeno. Ako svi krenemo na plavušu blokiraćemo jedan drugog. I ništa. Potom je besmisleno tražiti drugu šansu kod ostalih devojaka. Niko ne voli da bude drugi izbor.”
Neš nalazi neočekivano rešenje kao najbolje. Plavuša otpada. Epilog: četiri ortaka idu pravo kod njene četiri drugarice. Neš izleće da matematički pribeleži osnove rada za koji će dobiti Nobelovu nagradu skoro pola veka kasnije.
Na ovaj način su stotine miliona gledalaca prvi put imali priliku da čuju za Nešov ekvilibrijum. Neš njime nadopunjuje Smita. Optimalan rezultat za grupu dolazi kad svako u isto vreme radi i za sebe i za grupu. Plavuša, kao najbolji, ali rezultat koji može zadovoljiti samo pojedinca, žrtvovan je za najbolji rezultat čitave grupe.
Teorija igara svuda oko nas
Teorija igara je oblast primenjene matematike koja proučava ljudsko ponašanje i principe donošenja racionalnih odluka. Od svog nastanka, teorija igara je brzo zašla u pore brojnih oblasti svakodnevnog života poput ekonomije, saobraćaja, politike, ratovanja, diplomatije… Preciznije, teoriju igara je moguće koristiti svuda gde odluke pojedinaca imaju značajne efekte na funkcionisanje celine (sistema).
Jedan od opštepoznatih primera teorije igara je i dilema zatvorenika koja slikovito opisuje kako individualne akcije utiču na opšte dobro ili pak na opšte zlo.
Pretpostavimo da su Ana i Boban kriminalni partneri koji nisu imali sreće. Završili su u lisicama i policija pokušava da izvuče iz njih priznanje. Međutim, policija to radi tako što ih razdvoji u dve prostorije i zasebno ispituje tako da ih podstiče da odaju kolegu.
Ponuda je sledeća. Ako oboje ćute dobiće po tri godina zatvora. Ako oboje okrive jedno drugo dobiće po pet godine zatvora. Ako jedno prizna krivicu a drugo ne, onaj ko prizna dobija sedam godina, ko ne prizna biva oslobođen.
Svaki izbor u isto vreme nosi određenu vrstu rizika i dobiti. Svako bi želeo da bude slobodan, ali niko ne može da dođe do slobode samo svojim izborom. Uvek zavisi i od izbora onog drugog. Teorija igara kaže da se u datom slučaju Nešov ekvilibrijum dobija kada oboje reše da ćute i dobiju najmanju zatvorsku kaznu. U tom slučaju ukupan broj godina u zatvoru je šest. U svim ostalim situacijama je veći. Obostrano odavanje je ekvivalent Nešovoj grupi u kojoj svi nagrnu na plavokosu devojku. Maksimizacija štete.
Naravno, u praksi neće svi razmišljati tako. Napominjem da se teorija igara bavi racionalnim donošenjem odluka. Racionalnih je reč s kojom treba biti obazriv budući da se docnije ispostavilo da ipak emocije a ne logika većinski upravljaju donošenjem odluka.
Kako se tu uklapa blokčejn?
Definiciju blokčejna znamo, ali možemo je i rearanžirati iz tehnološkog u društveni okvir. Blokčejn je distribuirana mreža pojedinaca koji nezavisno donose odluke u cilju lične koristi (zarade) ali i opšteg dobra (prosperiteta mreže). Kada tako postavimo stvari, odčigledna je povezanost teorije igara i blokčejna. I što se više udubljujemo u principe blokčejna, primetićemo kako je teorija igara sveprisutna i značajna za njegovo funkcionisanje.
Satošijev princip prilikom osmišljavanja Bitkoina je bio udružiti kriptografiju i teoriju igara kako bi se stvorio sistem koji ne zavisi od centralnog autoriteta, i u kom sami akteri (tj. korisnici) okupljeni oko zajedničkog cilja čuvaju i održavaju mrežu.
Teorija igara kao kičma konsenzusnog mehanizma
Jedna od fascinantnosti blokčejn tehnologije leži u krekovanju problema da se svi (ili dovoljno) aktera slože oko toga šta je ispravno bez ikakvih međusobnih dogovora i bez potrebe za međusobnim poverenjem (trustless sistem).
Na rešenju te ideje nastali su konzenzusni mehanizmi koji omogućavaju da blokčejn efikasno i bezbedno funkcioniše. Uzevši u obzir da su ljudi tek teoretski kooperativna bića, postavlja se pitanje kako se došlo do toga da se ogroman broj korisnika uskladi da radi i za sebe i za opšte dobro?
U korenu tog usklađivanja ne može da leži samo vrednosni faktor. Istina je, kad se ljudi okupe oko velike ideje i emocionalno joj se predaju, žustro će je braniti i biti joj dosledni. Ipak, niti su svi ljudi isti, niti će uvek svi biti tu samo zbog ideje. Zato podsticaj za održavanje sistema u ravnoteži mora biti i finansijski. Ali obavezno takav da finansijska korist zloupotrebe sistema bude skuplja i teža za izvođenje od potencijalne dobiti. I tu teorija igara igra krucijalnu ulogu.
U jednom od prvih tekstova na ovom bloku dodakli smo se problema vizantijskih generala koje je suštinski pitanje poverenja gde činioci sistema treba da, nezavisno jedni od drugih, donesu najbolje odluke za sistem.
U tom misaonom problemu, vizantijski generali koji napadaju utvrđenje nisu sigurni da li će baš svaki general napasti utvrđenje jer jedino grupni napad omogućava pobedu, grupno povlačenje spašava živote, a nekompletan napad vodi u masakr. Zbog udaljenosti, komunikacija im je nemoguća što ih stavlja u poziciju da moraju da veruju jedni drugima i da predviđaju tuđe poteze.
A koliko sam ja tu dobar?
Distribuirane mreže kao što su blokčejni imaju tzv. vizantijsku toleranciju na grešku. To je osobina da u svakom trenutku ⅔ komputacione snage koja rešava kriptografske zadatke i validira transakcije mora da pripada pouzdanim nodovima.
Naravno, pouzdanost se neće zasnivati samo jer mislimo da će Pera, Žika i Mika biti fer igrači već i jer ih sistem nagrađuje za ispravno validiranje. A opet, sistem je tako postavljen da sve i da Pera, Žika i Mika nekim slučajem nakupe natpolovični hash rate (51% attack) i teoretski preuzmu mrežu to bi ih verovatno odvelo u bankrot.
Jedan od poznatijih blokčejn analitičara je naveo da bi gubici uspešnog 51% napada iznosili 10 hiljada evra po satu. Naime, toliko više novca dobijaju rudari da drže sistem validnim, te se više isplati biti pošten i zarađivati “malo” nego gramziv i pokušati da se uzme sve. Slično važi i za PoS mehanizam gde da bi neko zaposeo mrežu mora da ima kontrolu nad 51% stejkovane valute, što je, opet, skuplje nego sama vrednost te valute pa je cela akcija neisplativa.
Ipak, kao što je više puta ponovljeno, ljudi uglavnom nisu racionalni, te se nikad ne sme zanemariti mogućnost da neko pokuša napad zarad par minuta slave ili i iz čistog hira.
Biti deo stada se (uglavnom) isplati
Zamislite da treba da se sretnete u Beogradu sa jednom nepoznatom osobom koja želi da vam prenese bitnu informaciju. Nemate njen broj, niti bilo kakav drugi lični podatak. Imate samo jednu fotografiju te osobe i na poleđini datum i tačno vreme kada treba da se nađete. Ali gde u gradu od 1,6 miliona ljudi i bezbroj mesta za nalaženje?
Rešenje je nekad vrlo prosto. Sva je prilika da ćete, ako budete “kod Konja” u naznačeno popodne tog dana, ugledati tu osobu. U teoriji igara ova pojava se naziva fokalna tačka (nekad i Šelingova tačka) i ona predstavlja najverovatnije ishodište u odsustvu komunikacije.
E pa, glavni lanac blokčejna možemo da posmatramo i kao jednu fokalnu tačku. Svako ima pravo i mogućnost da se pridruži nekoj drugoj grani blokčejna (fork) koja iz bilo kog razloga nastane, ali je blokčejn tako ustrojen da se više isplati rudariti na glavnom toku. Zarađivati umereno za svoj rad je isplativija strategija nego podrivati čitav sistem jer slom velikih sistema kakvi su Bitkoin i Ethereum ne zahteva samo ogromne finansijske troškove već i do sad nezabeležen stepen koordinacije nad ogromnim brojem nodova (dakle ljudi).
Ipak, uvek postoji ono “šta ako”.
Zato je zanimljiv ugao koji je Vitalik opisao kao P+ε napad. Matrica po kojoj rudari odlučuju kom će se carstvu prikloniti, tj gde će uvrstiti naredni blok funkcioniše otprilike ovako:
P — nagrada za validiranje bloka
Dakle, ponašanje u skladu sa većinom donosi nagradu, izolovani čin ne daje ništa.
Međutim, u hipotetičkoj situaciji maliciozni napadač želi da nagradi onog ko glasa drugačije sumom P+ε, gde je epsilon dodatni mito. Začkoljica ove situacije leži u tome da napadač nepristojnu ponudu upućuje svim validatorima mreže.
Matrica sada izgleda:
Ako svako glasa tako da maksimizira svoju dobit, to implicira da će svi glasati za drugi lanac nezavisno od izbora drugih. U matrici se jasno vidi da je glas za drugi lanac racionalna opcija jer minimalno donosi osnovnu nagradu, a maksimalno donosi sve. Glas za osnovni lanac potencijalno ne donosi ništa.
To na kraju dovodi do bizarne situacije u slučaju da svi igraju racionalno i glasaju za drugi lanac. Napadač je preoteo sistem bez dinara za mito budući da su svi glasali isto i na kraju dobili osnovnu nagradu.
I naravno DeFi
Decentralizovane menjačnice, lending platforme i drugi DeFi protokoli se takođe baziraju na teoriji igara. Praktično, svaki od njih je jedna ogromna matrica u kojoj korisnici razrađuju sopstvene strategije kako bi maksimizovali profit. A opet same platforme moraju da pronađu modalitete i daju podsticaje koji ujedno privlače korisnike da koriste platformu ali na takav način da rade u cilju opšteg dobra.
Primera je pregršt, ali je možda najočigledniji liquidity pool bez kog DeFi protokoli ne bi mogli da postoje. Ustupajući svojoj novac protokolima korisnici istovremeno zadovoljavaju i pojedinačne ciljeve (dobijaju procenat), i opšte ciljeve (funkcionisanje, kredibilitet i potencijalni proseritet protokola).