Przeskocz do treści

Delta mi!

Artykuł o Końcu Świata

Łukasz Rajkowski

o artykule ...

  • Publikacja w Delcie: styczeń 2015
  • Publikacja elektroniczna: 1 stycznia 2015
  • Wersja do druku [application/pdf]: (296 KB)

Zderzenie z asteroidą, wojna nuklearna, globalny potop, przebiegunowanie Ziemi... liczba katastrof oznaczających koniec ziemskiej cywilizacji powinna skłonić nas do traktowania każdego spokojnego poranka, kiedy przewracamy się leniwie z boku na bok zamiast skwierczeć w ogniu Apokalipsy, jako prawdziwego cudu. Mnogość śmiercionośnych zagrożeń sprawia, że ludzkość od zamierzchłych czasów stara się przewidzieć datę (choćby przybliżoną) własnego końca, nie przejmując się zbytnio kolejnymi niepowodzeniami w tej materii. Większość z proponowanych terminów pochodziła od astrologów, numerologów lub przywódców religijnych. Zgodnie z powiedzeniem Hugo Steinhausa "Matematyk zrobi to lepiej" spróbujmy zastanowić się, co ma do powiedzenia w kwestii terminu Końca Świata Królowa Nauk.

Podobno Bóg nie gra z wszechświatem w kości, na potrzeby naszych rozważań wyobraźmy sobie jednak, że codziennie o świcie bierze On do Ręki symetryczną kość do gry o n przystających, foremnych ścianach. Ze względu na swoją Wszechmocność Bóg nie jest ograniczony wynikami Platona dotyczącymi liczby takich wielościanów, nie czynimy więc w tym momencie żadnych założeń dotyczących |n. Następnie kość jest rzucana i jeśli liczba wyrzuconych oczek przekroczy k, to ... cóż, jako ludzkość kibicujemy wartościom nie większym od |k. Postaramy się teraz zaproponować rozsądną wartość parametru | k, posługując się wiedzą, że przy dotychczasowej liczbie N rzutów (którą możemy przybliżyć przez 365 ⋅4,467⋅109 ) nie zaobserwowaliśmy jeszcze żadnej Apokalipsy.

Zauważmy, że w zależności od |k prawdopodobieństwo sukcesu (traktowanego jako kolejny dzień w historii ludzkości) wynosi

 k N ℒ(k) = (-) . n

Dość przekonująco wygląda teraz pomysł wyboru takiego k, które będzie maksymalizowało powyższą funkcję ℒ, zwaną w statystycznym żargonie funkcją wiarogodności. W pewnym sensie ustanowilibyśmy w ten sposób obserwowaną sytuację "najbardziej prawdopodobną", co wydaje się rozsądnym podejściem. Tak otrzymany estymator wartości k, zwany estymatorem największej wiarogodności, wynosi

 N kˆ= argmax (k-) = n, k n

gdzie argmaxk(f (k)) oznacza taką wartość k, dla której  f przyjmuje największą wartość. Jest to jednak mało emocjonujący wynik - oznaczałby przecież, że szansa na kolejny świt bez globalnej katastrofy wynosi 1, co stawiałoby pod znakiem zapytania przyszłość szeregu hollywoodzkich superprodukcji. Przeprowadźmy więc inną analizę - rozpocznijmy od założenia, że gdybyśmy nie byli świadkami N dni bez Apokalipsy, traktowalibyśmy każdą z wartości |k jako równie prawdopodobną. Jest to nasze założenie a priori odnośnie prawdopodobieństwa poszczególnych wartości |k, ilustrujące stan naszej wiedzy (tudzież niewiedzy) dotyczącej tego parametru. Zobaczmy teraz, w jaki sposób wiedza o naszym istnieniu rzutuje na wspomniane założenie - w tym celu posłużymy się wzorem Bayesa, pozwalającym na "odwracanie warunkowania" przy obliczaniu prawdopodobieństw warunkowych

 P(N dni bez K Ś parametr = k)⋅P(parametr = k) P(parametr = k Ndni bez KŚ )----------------------------------------------. P(N dni bez KŚ) (1)

Z założenia o jednostajności rozkładu parametru bez uwzględniania obserwacji stwierdzamy, że P(parametr = k) = 1n, ponadto oczywiście

 N k- P(N dni bez K Ś parametr = k) = ( n) .

Moglibyśmy teraz, korzystając ze wzoru na prawdopodobieństwo całkowite, pracowicie obliczyć mianownik prawej strony równości (1), zamiast tego posłużymy się jednak popularnym w podobnych wnioskowaniach fortelem. Zauważmy bowiem, że lewa strona równości (1) jest funkcją k, której wartości na argumentach ze zbioru {1,2,...,n} sumują się do 1 (gdyż stanowi ona rozkład prawdopodobieństwa na tym zbiorze). Z wcześniejszych obliczeń wynika, że z dokładnością do proporcjonalności ta funkcja wynosi  N k (wartość P(Ndni | bez K Ś) nie zależy od |k ), w związku z czym, aby spełniony był warunek sumowania się do 1 na zbiorze |{1,2,...,n}, musi być

 --kN--- P(parametr = k Ndni bez K Ś) = Pn iN. i 1

Otrzymaliśmy w ten sposób rozkład a posteriori badanego parametru, czyli "zweryfikowany" przez nasze obserwacje rozkład a priori.

Wszystko pięknie - zwróci uwagę Czytelnik Niecierpliwy - ale ja ciągle nie wiem, jaka jest szansa na jutrzejszy koniec świata. Istotnie, żadna propozycja estymatora wartości parametru nie została jeszcze przedstawiona. Dysponujemy jednak odpowiednim rozkładem prawdopodobieństwa, co wydaje się nieść więcej informacji niż przedstawienie jednej liczby. Jeśli jednak komuś zależy na konkretnym wyniku, może posłużyć się wartością oczekiwaną otrzymanego rozkładu, która wynosi

 n kN n iN E(parametr N dni bez KŚ) = Q k ⋅-n--= P-in- 1--. k 1 P i 1iN P i 1iN+1

Wobec tego za prawdopodobieństwo uniknięcia Apokalipsy możemy przyjąć

E(parametr-- N dni bez-KŚ) SNn+1- n = nSNn ,

gdzie przez SNn oznaczyliśmy sumę N -tych potęg n kolejnych liczb naturalnych. W tym momencie przypominamy sobie pewien kłopotliwy szkopuł - nie znamy wartości | n. Możemy jednak przypuszczać, że Bóg nie zadowoliłby się ordynarną kostką sześcienną; intuicja podpowiada, że w grę wchodzą kości o liczbie ścian przekraczającej liczbę ziaren piasku na Ziemi lub gwiazd na niebie. W tej sytuacji rozsądne wydaje się zbadanie, w jaki sposób powyższe wyrażenie zachowuje się przy n zbiegającym do nieskończoności. W tym celu zauważmy, że

pict

co po odjęciu obustronnie SN+2 +PN (N+2)S j n j 0 j n i podzieleniu przez |N+ 2 prowadzi do rekurencyjnego wzoru

 N SN+1 = --1--⎛ (n +1)N+2 − (N + 2 )Sj ⎞. n N+ 2 ⎝ Q j 0 j n⎠

Możemy stąd za pomocą prostej indukcji wywnioskować, że |SN n jest wielomianem od | n stopnia | N +1, o współczynniku przy najwyższej potędze równym  1 N+1. W tej sytuacji  N+1 |Sn oraz  N |nSn są wielomianami od n o równym stopniu, zatem granica ich ilorazu, przy |n zbiegającym do nieskończoności, jest ilorazem ich współczynników przy najwyższej potędze, czyli N+1 N+2. Jeśli zaś estymujemy prawdopodobieństwo Zniszczenia Świata przez  1 |N+2, to wartość oczekiwana liczby dni, jaka nam została do tego zdarzenia, wynosi N + 2, czyli drugie tyle, co już było i jeszcze dwa dni (trzeciego skończy grać Wielka Orkiestra Świątecznej Pomocy).

Oczywiście, powyższe rozważania nie mogą być traktowane poważnie, ilustrują jednak dwie poważne koncepcje wnioskowania statystycznego - klasyczną oraz bayesowską. Fundamentalną różnicą między nimi jest dopuszczenie przez podejście bayesowskie rozkładu prawdopodobieństwa na zbiorze możliwych parametrów. Zasadność takiej operacji może budzić wątpliwości - tworzymy wówczas w naszym wnioskowaniu kolejne (po wyborze rodziny rozkładów rządzących doświadczeniem) czysto uznaniowe ogniwo, jakim jest wybór rozkładu a priori na zbiorze parametrów. Z drugiej strony jednak ta uznaniowość zwiększa elastyczność naszego modelu, gdyż pozwala uwzględnić eksperckie "widzimisię" dotyczące parametrów; ponadto, kiedy już ów rozkład zostanie przyjęty, cała reszta naszej dedukcji to czysto probabilistyczne obliczenia, co niekoniecznie jest prawdą w przypadku podejścia klasycznego. Spór między zwolennikami tych metodologii trwa, a na jego rozwiązanie nie pozostało wiele czasu - zgodnie z informacjami zamieszczonymi w angielskiej Wikipedii najbliższy Koniec Świata już w marcu.