Przeskocz do treści

Delta mi!

Gra w sumo

Michał Miśkiewicz

o artykule ...

  • Publikacja w Delcie: styczeń 2018
  • Publikacja elektroniczna: 1 stycznia 2018
  • Wersja do druku [application/pdf]: (108 KB)

Czy Czytelnik zna grę w przeciąganie liny? Dwie drużyny ciągną dwa końce liny w przeciwne strony, a wygrywa ta, której uda się przeciągnąć linę na swoją stronę. Ściślej, gra kończy się w momencie wyjścia środka liny (zazwyczaj oznaczonego wstążką) z umówionego pola gry. Matematycy przypisują tę samą nazwę podobnej grze rozgrywającej się w dwóch (i więcej) wymiarach, w której to środek liny może poruszać się w wielu kierunkach, a nie tylko lewo-prawo. Trudno sobie jednak takie przeciąganie wyobrazić, dlatego przyjąłem termin gra w sumo.

obrazek

Plansza do gry w sumo (dalej oznaczana przez  -- |Ω ) składa się z pewnej liczby pól na szachownicy. Każde pole szachownicy P ma czterech sąsiadów, oznaczanych tutaj P1,P2,P3,P4. Pole nazwiemy wewnętrznym, jeśli leży na planszy razem ze swoimi sąsiadami, w przeciwnym przypadku nazwiemy je brzegowym. Zbiór pól wewnętrznych oznaczymy przez Ω a brzegowych przez ∂Ω

Dwoje zawodników, Jaś i Małgosia, zaczyna grę na pewnym polu |P leżącym na planszy. Jeśli pole P jest brzegowe, gra się kończy. W przeciwnym przypadku rzut symetryczną monetą decyduje, który z zawodników uzyskuje w tej turze przewagę nad przeciwnikiem, dzięki czemu przepycha go na wybrane przez siebie sąsiednie pole (i z rozpędu sam też tam ląduje). Gra toczy się w turach do momentu, gdy gracze wylądują na polu brzegowym.

obrazek

Rys. 1 Przykładowa plansza i funkcja rozstrzygnięcia. Jak widać, Małgosia postanowiła dać Jasiowi fory.

Rys. 1 Przykładowa plansza i funkcja rozstrzygnięcia. Jak widać, Małgosia postanowiła dać Jasiowi fory.

Kto wygrywa? Podobnie jak w grze w przeciąganie liny, musimy się na coś umówić. Dojście do pewnych pól brzegowych będzie oznaczać wygraną Jasia, a do innych - Małgosi. Przyjętą umowę możemy opisać za pomocą jednej funkcji |g ∂Ω określonej wzorem

 ⎧ ⎪⎪1 jeśli dojście do P daje wygran ą Ma łgosi, g(P ) = ⎨⎪⎪0 jeśli Jasiowi. ⎩

Przebieg gry jest więc zdeterminowany przez planszę  -- |Ω, funkcję rozstrzygnięcia |g, decyzje zawodników, losowe wyniki rzutów monetą oraz wybór pola startowego.

W dalszej części artykułu przyjmiemy, że Jaś i Małgosia mają ustalone racjonalne strategie, czyli przy każdym przepchnięciu przeciwnika wybierają sąsiednie pole w taki sposób, by zmaksymalizować prawdopodobieństwo swojej wygranej. Jeśli dodatkowo ustalimy pole startowe P , to gra jest już czysto losowa i możemy określić warunkowe prawdopodobieństwo wygranej Małgosi:

h(P ) = P(wygra Ma łgosia gra startuje z P).

W ten sposób otrzymaliśmy pewną funkcję  -- |h Ω R. Gdy |P jest polem brzegowym, gra kończy się już na starcie, a jej rozstrzygnięcie jest opisane funkcją g, a zatem h(P ) = g(P ). Rozgrywka robi się ciekawsza, jeśli |P jest polem wewnętrznym. Z prawdopodobieństwem  1 |2 chwilową przewagę uzyska Małgosia i przepchnie Jasia na takie sąsiednie pole Pi (gdzie |i = 1,2,3,4 ), dla którego prawdopodobieństwo przyszłej wygranej h(Pi) jest możliwie największe. Jeśli z kolei los padnie na Jasia, wybierze on takiego sąsiada P j, dla którego |h(P j) jest najmniejsze. Ze wzoru na prawdopodobieństwo całkowite otrzymujemy więc

pict

Dla dowolnej funkcji |h różnicę obu stron powyższej równości oznaczymy przez

 1- ∆h(P ) = 2( mi a 1x,2,3,4h(Pi) + m j i 1n,2,3,4h(Pj )) − h(P ).

Wyrażenie to jest nazywane dyskretnym operatorem |∞ -Laplace'a (chociaż Pierre-Simon de Laplace (1749-1827) nigdy takiego nie rozważał). Dotychczasowe rozważania możemy podsumować następująco - funkcja  -- h Ω R jest rozwiązaniem zagadnienia

⎧ ⎪⎪ ∆h(P ) = 0 dlaP ∈ Ω ⎨⎪⎪ h(P) = g(P) dlaP ∈ ∂Ω ⎩ (*)

Do znalezienia rozwiązania wykorzystamy metodę noszącą imię Oskara Perrona |(1880 − 1975) ; noszącą bardzo słusznie, gdyż to jemu ją zawdzięczamy. Opiera się ona na własnościach funkcji v spełniających nierówność |∆v ⩾ 0 zamiast równości. Są to tak zwane podrozwiązania, których rodzinę oznaczymy przez

 -- V = {v Ω R ∆v(P )⩾ 0 dla P ∈ Ω

Rodzina V jest niepusta - należy do niej, na przykład, funkcja v zerująca się na Ω i równa funkcji |g na ∂Ω Ponadto wszystkie funkcje |v∈ V są ograniczone z góry przez 1, co wynika z następującego faktu:

Zadanie 1 (zasada maksimum). Jeśli ∆ v(P) ⩾0 dla |P∈ Ω oraz |v(P) ⩽M dla P ∈ ∂Ω to również v(P )⩽ M dla P ∈ Ω

Wskazówka. Jeśli v(P ) przyjmuje największą wartość dla pewnego pola P ∈Ω to przyjmuje tę samą wartość również dla wszystkich pól sąsiednich.

Jesteśmy teraz gotowi zdefiniować rozwiązanie.

Twierdzenie 1 (o istnieniu). Funkcja  -- h Ω R określona wzorem

h(P) = suvp>V v(P )

jest rozwiązaniem zagadnienia (*).

Dotychczasowe uwagi na temat rodziny V pozwalają stwierdzić, że powyższy wzór jest poprawny, a ponadto 0 ⩽ h(P) ⩽ 1 dla wszystkich | -- P ∈Ω . Narzuca się pytanie, czy znaleziona właśnie funkcja | h pokrywa się z rozważaną wcześniej funkcją opisującą prawdopodobieństwo wygranej. Poniższe zadanie rozwiewa tę wątpliwość.

Zadanie 2 (o jednoznaczność). Zagadnienie (*) ma tylko jedno rozwiązanie.

Wskazówka. Rozważyć dwa rozwiązania |h1,h2 i powtórzyć rozumowanie z zadania 1 dla funkcji |h1− h2, starannie dobierając punkt o ekstremalnych własnościach.

Dowód twierdzenia opiera się na dwóch wyjątkowych własnościach rodziny |V, których samodzielne sprawdzenie nie powinno sprawić Czytelnikowi problemu.

Zadanie 3. Jeśli funkcje v1,...,vk należą do V , to funkcja |v określona jako ich maksimum

 -- v(P) = max(v1(P ),...,vk(P )) dlaP ∈Ω

również należy do V .

Zadanie 4. Jeśli v ∈V oraz P ∈ Ω to funkcja ---- v Ω R określona przez

pict

również należy do rodziny V . Ponadto  -- ∆ v(P) = 0 oraz v(Q) dla |Q

Dowód twierdzenia. Równość |h(P) = g(P) dla P ∈ ∂Ω wynika wprost z określenia |V i |h, pozostaje nam sprawdzić równość ∆ h = 0 ; ustalmy więc pole |P ∈Ω Z określenia |h wynika, że dla każdej liczby |ε> 0 istnieje funkcja |v0∈ V spełniająca v0(P) > h(P ) −ε. Podobnie dla każdego sąsiedniego pola Pi znajdziemy funkcję vi∈ V, dla której |vi(Pi) > h(Pi) − ε. Ich wspólne ograniczenie |v = max(v0, v1,v2,v3,v4) należy do rodziny V na mocy zadania 3 oraz

v(Q)

Skonstruowana w zadaniu 4 funkcja v- również spełnia te nierówności, a ponadto dzięki -- v ∈ V mamy -- v(Q) dla wszystkich Q W rezultacie

 max h(Pi) − max v(Pi) , min h(P j)− min v(P j) < ε. i 1,2,3,4 i 1,2,3,4 j 1,2,3,4 j 1,2,3,4

Porównanie liczb |∆h(P ) i  -- ∆v(P ) (ta druga jest zerem!) przy użyciu nierówności trójkąta daje

 ∆ h(P) = ∆h(P )− ∆ v(P) < 1(ε +ε) +ε = 2ε. 2

Powyższa nierówność jest prawdziwa dla dowolnie małej liczby |ε> 0, a więc zachodzi żądana równość ∆ h(P ) = 0.


obrazek

Rys. 2 Przybliżone rozwiązanie dla planszy i funkcji rozstrzygnięcia z rysunku 1

Rys. 2 Przybliżone rozwiązanie dla planszy i funkcji rozstrzygnięcia z rysunku 1

Zależnie od swojego filozoficznego usposobienia Czytelnik może być z tego dowodu zadowolony lub nie. Wykazaliśmy istnienie rozwiązania h, ale nie wyznaczyliśmy funkcji h jawnym wzorem. Tę wadę ma zresztą większość metod stosowanych obecnie w równaniach różniczkowych cząstkowych, do których zagadnienie (*) zalicza się jako dyskretny odpowiednik.

Problem ten można częściowo obejść. Funkcja h jest większa lub równa każdej funkcji v ∈V , więc stosując na przemian konstrukcje z zadań 3 i 4, możemy znaleźć coraz lepsze przybliżenia z dołu. Gdybyśmy natomiast w definicji rodziny |V zastosowali przeciwny znak nierówności (czyli |∆v ⩽ 0 ), to funkcję |h otrzymalibyśmy jako infimum tej rodziny, co pozwala znaleźć przybliżenia h również z góry. W ten sposób możemy znaleźć wartości h z dokładnością dwóch cyfr po przecinku dla planszy z rysunku 1 Warto zwrócić uwagę, że dopiero wtedy jesteśmy w stanie przeprowadzić symulacje naszej rozgrywki. O dziwo, w rzeczywistości zawodnicy sumo radzą sobie doskonale bez wykonywania takich obliczeń...