Przeskocz do treści

Delta mi!

Nagrody Nobla

Polowanie na jelenia i równowagi Nasha

Jacek Miękisz

o artykule ...

  • Publikacja w Delcie: listopad 2001
  • Publikacja elektroniczna: 23-06-2011
obrazek

wikipedia

John Forbes Nash, Jr.

wikipedia

John Forbes Nash, Jr.

W 1762 roku Jean Jacques Rousseau napisał: „Polujący na jelenia myśliwi są w pełni świadomi, że aby go upolować, muszą być lojalni wobec siebie i pozostać na swoich posterunkach. Jeżeli jednak zając przebiegnie w pobliżu jednego z nich, nie ma wątpliwości, że myśliwy ten ruszy za pewną zdobyczą, doprowadzając do fiaska polowanie na jelenia.” Przetłumaczmy to na język współczesnej teorii gier...

Aby sprecyzować model teoriogrowy, musimy określić zbiór graczy math zbiór dostępnych im strategii math  oraz funkcje wypłat math gdzie math; wypłata każdego gracza zależy nie tylko od jego strategii, lecz również od strategii wszystkich jego oponentów, to znaczy profilu strategii math W naszym przypadku każdy z dwóch myśliwych ma do dyspozycji dwie strategie: jelenia (J) albo zająca (Z). Aby podać funkcję wypłat, musimy wpierw przypisać obu nieszczęsnym zwierzętom określoną wartość. Niech jeleń będzie wart math jednostek ekonomicznej użyteczności, a zając math Upolowany jeleń dzielony jest równo między dwóch graczy ze strategią J, zając przypada w całości każdemu graczowi ze strategią Z. Funkcja wypłat przybiera wtedy postać macierzy math której element math jest wypłatą gracza pierwszego (wierszowego) grającego strategią math podczas gdy gracz drugi (kolumnowy) gra strategią math:

display-math

Gra jest symetryczna, co oznacza, że wypłaty gracza drugiego są dane przez macierz transponowaną do U. Gra jest rozgrywana w ten sposób, że gracze jednocześnie ogłaszają swoje strategie i dostają odpowiednie wypłaty. Macierz wypłat jest znana każdemu graczowi, który wie, że każdy z jego oponentów ją zna, wie, iż jego oponenci wiedzą, że on ją zna...

Pojawia się naglące pytanie: Jak grać? John Nash zaproponował następującą definicję równowagi. W równowadze Nasha, przy ustalonych strategiach przeciwników, żadnemu z graczy nie opłaca się zmienić swojej strategii. Formalnie:

Definicja. math  jest równowagą Nasha, jeśli dla każdego math i math   math  gdzie math

W naszym przykładzie mamy dwie równowagi Nasha: math i math Stajemy więc przed problemem wyboru jednej z nich. Pierwsza równowaga daje nam największe wypłaty, druga natomiast jest dominująca ze względu na ryzyko – pojęcie zaproponowane przez Seltena i Harsanyi’ego. Zakładamy, że przeciwnik z jednakowym prawdopodobieństwem math zagra jedną z dwóch strategii. Wybieramy strategię, która daje nam większą wartość średnią. W naszym przypadku średnia wypłata dla strategii Z wynosi math i jest większa od średniej wypłaty dla strategii J równej math Warto wspomnieć, że za swój wkład w teorię gier John Nash, Reinhard Selten i John Harsanyi zostali uhonorowani w 1994 roku Nagrodą Nobla z ekonomii.

Ostatnio zostało zaproponowanych kilka modeli dynamicznych, w których tylko niektóre równowagi Nasha danej gry są stabilnymi punktami stacjonarnymi, a więc zostają wybrane. Badaniem dynamicznego dochodzenia do równowag Nasha zajmuje się ewolucyjna teoria gier, o której, być może, napiszemy w przyszłości.

Wnikliwy Czytelnik zada oczywiście pytanie, czy każda gra ma równowagę Nasha. W odpowiedzi poprosimy wnikliwego Czytelnika o skonstruowanie dwóch gier niemających równowag Nasha: symetrycznej gry z trzema strategiami oraz gry niesymetrycznej (wypłaty dla gracza wierszowego i kolumnowego dane są przez dwie niezależne macierze) z dwiema strategiami.

Aby tradycji matematycznej stało się zadość i wystąpiło twierdzenie o istnieniu, wprowadźmy strategie mieszane. Strategia mieszana math-tego gracza to rozkład prawdopodobieństwa na zbiorze strategii czystych math czyli math  nieujemnych liczb math sumujących się do math; math jest prawdopodobieństwem, z jakim math-ty gracz zagra strategią math-tą. Przyjmujemy, że wypłata z profilu strategii mieszanych dana jest przez jej wartość oczekiwaną i uogólniamy w oczywisty sposób definicję równowagi Nasha, podstawiając w niej math za math  Zachodzi wtedy następujące

Twierdzenie. Każda gra ze skończoną liczbą graczy i strategii ma co najmniej jedną równowagę Nasha w strategiach mieszanych.

Dowód wykorzystuje jedno z twierdzeń o punkcie stałym (równowaga Nasha jest najlepszą odpowiedzią na równowagę Nasha).

Ambitnego Czytelnika poprosimy teraz o znalezienie wszystkich równowag Nasha dla dowolnej symetrycznej gry dwuosobowej z dwiema strategiami. Udowodni on w ten sposób powyższe twierdzenie dla tej klasy gier.

Przenieśmy się teraz z osiemnastowiecznego lasu do współczesnego miasta, gdzie dwóch pracowników właśnie zasiadło do wykończenia wspólnego projektu. Każdy z nich może albo pracować, math  albo oszukiwać, czyli pozorować pracę, math   math; praca wymaga inwestycji math jednostek naszej użyteczności. Przychód z wykonanego projektu math  jest dzielony równo między partnerów. Powyższa gra ma następujące przedstawienie macierzowe:

display-math

Jedyną równowagą Nasha jest profil math Zauważmy, że w przypadku pracy obu partnerów ich wypłata jest większa. Profil math nie jest jednak równowagą Nasha. Staramy się więc działać racjonalnie, grać strategią w jedynej równowadze Nasha i efektem tego jest obustronny brak korzyści. Powyższa gra znana jest pod nazwą Dylematu Więźnia. Aby zrozumieć występowanie zachowań altruistycznych w układach rywalizujących jednostek, zaproponowano ostatnio proste modele dynamiczne, w których stabilne punkty równowagi nie są równowagami Nasha. Przeszliśmy więc od problemu wyboru jednej z równowag Nasha do problemu znalezienia równowagi nie będącej równowagą Nasha. Analiza dynamicznych strategii prowadzących do współpracy w powtarzanej grze typu Dylemat Więźnia wymaga oddzielnego omówienia.