Hlavní obsah
Věda

Naivní mírová strategie a užití kazetové munice pohledem teorie her

Foto: Pixabay.com, SutoriMedia

Teorie her je poměrně novým oborem aplikované matematiky a ekonomie. Již její úplné základy ukazují nesmyslnost či naivitu některých názorů šířených podporovateli utopického mírového řešení.

Článek

Teorie her a vězňovo dilema

Jedna z definic říká, že teorie her je disciplína, která analyzuje lidské chování ve strategických situacích. Pojmem „strategické“ se myslí situace, ve kterých každá osoba při rozhodování o svém jednání musí brát ohled na to, jak mohou ostatní (hráči) na toto jednání zareagovat.

Nejčastěji se základy vysvětlují na tzv. vězňovu dilematu. Dva podezřelí A a B (z pohledu teorie hráči) jsou vyslýcháni policií. Důkazy, které má policie nejsou dostatečné pro usvědčení. Podezřelí jsou vyslýcháni zvlášť, neznají výpověď druhého a mohou buď mluvit nebo mlčet. A právě jejich chování určí výši trestu tak jak uvádí tabulka.

Foto: Vidlákovy peníze

Teorie her a matice pro vězňovo dilema

Na první pohled je nejlepší variantou, pokud oba z vězňů budou mlčet, oba si odsedí pouze jeden rok a pak budou volní. Z pohledu uvažování jednoho vězně je ale situace jiná, např. A přemýšlí:

  • Pokud bude B mlčet a já také, dostanu trest na 1 rok, takže bude lepší mluvit a být hned volný.
  • Pokud bude B mluvit a já mlčet, dostanu 10 let, takže bude lepší mluvit, protože dostanu jen 5 let jako on za to, že vypovídal.

Stejně uvažuje i B. Pokud oba udělají racionální rozhodnutí = oba budou vypovídat, dostanou oba trest 5 let, přestože optimálním rozhodnutím by bylo mlčet.

Firmy, zbrojení a naivní mírotvorství

V ekonomii je typickým příkladem uplatnění teorie her konkurenční souboj. Mějme na trhu pouze dva mobilní operátory. Pokud by žádný z nich neutrácel za reklamu (spolupráce), rozdělili by si trh zhruba půl na půl. Pokud by ale jeden z nich začal inzerovat (zrada), získal by zákazníky i od druhé společnosti. Ve výsledku budou inzerovat obě firmy a jejich zisky budou nižší díky nákladům na reklamu. Přestože pro obě firmy by bylo nejvýhodnější neinzerovat, dříve či později jedna z firem začne, protože je to výhodnější strategie v rámci teorie her.

Na úrovni států najdeme „vězňovo dilema“ právě ve zbrojení. Pokud by země žily v míru, úspora nákladů za armádu a vojenskou techniku by byla obrovská. Žádná země si ale nemůže dovolit zůstat neozbrojena. V takovém případě by ve válečném konfliktu vyhrála ozbrojená země. Stav „nezbrojím“ není pro žádný stát rovnovážný, protivník ho může snadno zneužít a hru (=válku) vyhrát.

Foto: Vidlákovy peníze

Teorie her a matice pro mírový paradox

Matematika a konkrétně teorie her říká jasně: chceš-li mír a svobodu, musíš zbrojit. Ještě nedávno mohli naivní zastánci míru argumentovat tím, že mezinárodní dohody nám umožňují snižovat náklady na armádu. V těchto dohodách se státy zaručí za neměnnost hranic a poskytnou další garance. Únor 2022 ukázal, že například pro současné Rusko jsou podobné dohody pouze cárem papíru.

Ještě naivnější návrhy na ukončení rozehrané hry (probíhající války) spočívají v ukončení dodávání zbraní bránící se Ukrajině. V takovém případě jsme z pohledu teorie her jednomu hráči sebrali krví vykoupený, ale alespoň rovnovážný stav spočívající v obraně (protiofenzivě) a výsledkem je obsazení celého území Ukrajiny Ruskem.

Neznalost nebo lež

Proč někdo navrhuje nesmyslná řešení, která jsou již od poloviny minulého století vědeckou teorií her vyvrácena? Důvody jsou zejména dva, trochu omluvitelná je neznalost. Pro někoho je paradoxem, že cesta k míru vede skrze zbrojení, vycvičenou armádu a národ, který je připraven za svou svobodu bojovat a svobodu jiných podporovat. Na školách se základy teorie her neučí, a ne každý je schopen si uvědomit dopady jednotlivých scénářů.

Horší je ale lež. Dotyčný si dobře uvědomuje potřebu zbrojení a podporu Ukrajiny pro naši svobodu, ale jeho ekonomické či politické zájmy jsou pro něj důležitější. Místo aby přiznal, že k míru vede cesta skrze dodávku zbraní, raději hovoří o „alternativní“ cestě k míru, která ale neexistuje. Je to stejné, jako kdyby tvrdil, že 1+1=3. Hloupost ani lež totiž nejsou názor, ale stále jen hloupost nebo lež.

Kazetová munice

O víkendu vzbudila pozornost zpráva o dodávkách kazetové munice. I zde bychom mohli místo zbytečných emocí a subjektivních názorů nahlédnout do teorie her a zjistit pragmatické doporučení. Situace jako vězňovo dilema zmíněné v první části článku se dá zobecnit následujícím způsobem: místo jedné volby si představme opakování celé situace. V dalších tazích oba hráči opět volí mezi spoluprací nebo zradou.

Opakováním dostává hra nový rozměr. Hráči mohou vzít v potaz chování protihráče v předchozích krocích. Pokud soupeř v prvním kole zradil a on spolupracoval, může nyní oplatit zradu zradou nebo může stále trvat na spolupráci. Zatímco nalezení optimální strategie u neopakujícího se vězňova dilema bylo snadné, u opakování je situace výrazně variabilnější a najít jedno nejlepší řešení často ani nejde. I zde ale díky simulacím a pokusům známe lepší a horší strategie. Nejdříve uveďme seznam hlavních způsobů chování (známé i z běžného života):

  • TFT (Tit For Tat, Oko za Oko) – začne spoluprací. A v dalším kroku zvolí to, co v předchozím kroku udělal soupeř. Proto Oko za oko.
  • AllC (Always cooperates) – vždy spolupracující strategie, ať soupeř dělá cokoliv.
  • AllD (always defects) – vždy zrada, ať soupeř dělá cokoliv.
  • Pavlov (také win-stay, lose-shift) – začíná spoluprací a pokračuje v ní, pokud v předchozím kole zvolili oba hráči stejnou strategii, jinak zradí.
  • RAND (Random) – náhodné tahy spolupráce či zrada s pravděpodobností 50 %.
  • GRIM trigger – strategie, která začíná spoluprací, ale v případě, že ji zradí protihráč, zrazuje neustále. Lze modifikovat tak, že začne zrazovat až po určitém počtu (např. 3 nebo 10) zrad soupeře.

Algoritmů (způsobů chování) jde vymyslet mnohem více a například v „turnaji algoritmů“ uspořádaném v 70. letech minulého století jich proti sobě stálo dokonce 63. A mezi nimi se jako nejvíce efektivní ukázal ten, který zvítězil již v prvním turnaji v roce 1979. Byl to algoritmus TFT, tedy „Oko za oko“.

Jaké z toho plyne poučení? Nevyhrávají hodní hráči (AllC), nevyhrávají zlí hráči (AllD), nevyhrává zmatená náhodná strategie (RAND). V matematických modelech a podobně v reálném životě vyhrává jednoduchá, ale účinná strategie, která oplácí soupeři. Rusko používá kazetovou munici od počátku agrese, a to dokonce i na civilní cíle. Teorie her říká, že pro vítězství je třeba soupeři oplatit stejným krokem. Při dodržení závazku neútočení na civilní cíle je třeba užití kazetové munice jednoznačně podpořit. Teorie her nám objasnila proč.

-----------

Doporučená literatura: pokud tě zaujala teorie her, možná oceníš on-line dostupnou diplomovou práci Hany Krakovské na téma Opakované vězňovo dilema. Pro Vidláka byla inspirací ke vzniku tohoto článku. Vidlák děkuje!

Máte na tohle téma jiný názor? Napište o něm vlastní článek.

Texty jsou tvořeny uživateli a nepodléhají procesu korektury. Pokud najdete chybu nebo nepřesnost, prosíme, pošlete nám ji na medium.chyby@firma.seznam.cz.

Sdílejte s lidmi své příběhy

Stačí mít účet na Seznamu a můžete začít psát. Ty nejlepší články se mohou zobrazit i na hlavní stránce Seznam.cz