Epidemie
Stochastyczne i deterministyczne modele epidemii
Zjawiska opisywane na poziomie "mikro" przez procesy Markowa zachowują się na poziomie "makro" jak funkcje deterministyczne, będące rozwiązaniami równań różniczkowych. Można to zaobserwować na przykładzie prostego (ale, niestety, bardzo aktualnego w chwili pisania tego artykułu) modelu początkowej, wykładniczej fazy epidemii.
Rozważmy bardzo dużą populację. Niech oznacza liczbę zarażonych w chwili Zakładamy, że w krótkim okresie czasu każdy z nich zaraża średnio innych ludzi, ale przy tym z prawdopodobieństwem zdrowieje lub umiera i przestaje zarażać. Deterministyczny model jest następujący:
(1) |
(Traktujemy jako wielkość ciągłą. Symbol oznacza nieskończenie małą rzędu wyższego niż czyli funkcję spełniającą równość ) Oczywiście (1) sprowadza się do zwyczajnego równania różniczkowego:
Popatrzmy na to samo zjawisko z bliska (w skali mikro). Potraktujmy jako zmienną losową o wartościach całkowitoliczbowych. Ewolucja procesu jest opisana równaniami
(2) |
Zakładamy, że jest procesem Markowa, to znaczy ewolucja procesu po chwili zależy tylko od czyli stanu w chwili a nie od wcześniejszej "historii" procesu. Jest to skokowy proces Markowa: w losowych momentach proces rośnie lub maleje o 1. Żeby lepiej zrozumieć strukturę tego procesu i sposób jego symulowania, przyjrzyjmy się czasom pomiędzy skokami, gdzie
Okazuje się (co zostanie uzasadnione na końcu artykułu), że jest zmienną losową o rozkładzie wykładniczym z parametrem . Ponadto
Łatwo w to uwierzyć, patrząc na równania (2).
Przebieg procesu symulujemy zatem, losując kolejno czasy i stany zgodnie z dwiema powyższymi regułami. Chemicy, biolodzy i epidemiolodzy znają tę metodę pod nazwą algorytmu Gillespie'go. W rzeczywistości taki opis skokowego procesu Markowa podał znakomity amerykański matematyk czeskiego pochodzenia, Joseph Doob. Przykładowy przebieg krótkich symulacji przedstawiamy w poniższej tabelce i na rysunku 1.
Popatrzmy teraz na dłuższe przebiegi symulacji i porównajmy trajektorie procesu losowego z rozwiązaniem równania różniczkowego, czyli funkcją wykładniczą Przyjęliśmy następujące wartości parametrów: (śledzimy rozwój epidemii od pierwszego zarażonego). Na rysunku 2 przedstawionych jest 20 niezależnych trajektorii procesu Markowa. Spośród tych 20 trajektorii 12 wpadło dość wcześnie w stan 0. Jest to stan "pochłaniający": jeśli to dla każdego mamy Pogrubiona, kolorowa linia to wykres funkcji wykładniczej.
Uderzającą cechą procesu losowego opisanego równaniami (2) jest zgodność trajektorii w makroskali z rozwiązaniem równania różniczkowego, czyli z funkcjami wykładniczymi Poszczególne realizacje procesu różnią się jednak wyraźnie przesunięciem w fazie To widać na rysunku 3, na którym oś pionowa została przedstawiona w skali logarytmicznej. Rysunek 4 pokazuje te same 20 trajektorii w początkowym okresie rozwoju. Wspomniane wyżej przesunięcia w fazie wynikają z losowych fluktuacji na początku. Rezultatem tych losowych fluktuacji jest to, że 12 spośród przedstawionych trajektorii jest "pochłoniętych" przez zero. Dalszy przebieg procesu jest niemal deterministyczny.
Model SIR
Rozważmy populację złożoną z osobników. Niech oznacza liczbę zarażonych w chwili zaś łączną liczbę uodpornionych i zmarłych. Liczba osobników narażonych na zakażenie jest równa Osobnik typu może przejść do kategorii a stąd do kategorii (stąd nazwa "model SIR"). Schematycznie:
Zakładamy, że w krótkim okresie czasu każdy osobnik zaraża średnio innych ludzi, a z prawdopodobieństwem zdrowieje lub umiera i przestaje zarażać. Zauważmy, że jeśli to dostajemy model fazy wykładniczej, przedstawiony w zadaniu poprzednim.
Klasyczny model deterministyczny jest następujący:
(3) |
oraz Oczywiście (3) jest układem równań różniczkowych zwyczajnych:
(4) |
W skali mikro traktujemy i jako zmienne losowe o wartościach całkowitoliczbowych. Stan układu jest parą Ewolucja procesu jest opisana równaniami
(5) |
Symulacja procesu opisanego powyższymi równaniami również może zostać przeprowadzona przy użyciu algorytmu Gillespie'go. Tym razem jednak musimy monitorować dwie wielkości - liczbę zainfekowanych oraz liczbę osobników podatnych na zakażenie . Jeśli liczby te wynoszą i odpowiednio, to czas oczekiwania na kolejne "zdarzenie" (czyli zainfekowanie nowej osoby lub wyzdrowienie/śmierć osoby zarażonej) ma rozkład wykładniczy z parametrem Kiedy już dojdzie do zdarzenia, to z prawdopodobieństwem jest to nowe zarażenie (oraz wyzdrowienie/śmierć w przeciwnym przypadku). Nowe stany odpowiadające tym dwóm rodzajom zdarzeń to, odpowiednio, oraz Oczywiście symulacja kończy się, kiedy
Na rysunku 5 widać kilka trajektorii procesu opisanego równaniami (5), wraz z zaznaczonym kolorem rozwiązaniem równania różniczkowego (4). Przyjęliśmy następujące wartości parametrów:
Początkowo trajektorie zachowują się tak, jak w modelu poprzednim: najpierw sporo losowych fluktuacji, później następuje faza wykładniczego wzrostu. Jeszcze później widać zupełnie inne zjawisko: hamowania wzrostu wskutek spadku liczby narażonych aż do zupełnego wygaśnięcia epidemii.
Dla różnych realizacji tego samego procesu SIR widać duże przesunięcia w fazie, wynikające z losowego charakteru początkowego fragmentu. Losowe fluktuacje (głównie początkowe) mają też pewien (niewielki) wpływ na maksymalną liczbę zarażonych (maksima poszczególnych krzywych).
W opracowaniach dotyczących rozwoju epidemii często przedstawia się również liczbę wszystkich osób, które zostały zainfekowane do danego momentu (tzn. liczbę zdarzeń polegających na zarażeniu nowej osoby). Liczba ta odpowiada procesowi widocznemu na rysunku 6. Warto zwrócić uwagę na niewielkie fluktuacje liczby wszystkich osób, które zostały zakażone do czasu wygaśnięcia epidemii.
Przedstawione w tym artykule modele rozwoju epidemii są skrajnie uproszczone i nie nadają się do ilościowego opisu rzeczywistego zjawiska. Niemniej nawet takie modele pozwalają trochę zrozumieć mechanizm epidemii na poziomie jakościowym.
Dlaczego czasy oczekiwania na skok mają rozkład wykładniczy?
Aby udowodnić, że zmienna ma rozkład wykładniczy z parametrem wystarczy pokazać, że zmienna ma rozkład jednostajny na odcinku tzn. że dla dowolnego :
Przyjrzyjmy się czasowi pierwszego skoku, Nietrudno uwierzyć, że
gdzie druga równość wynika z (2). Jeśli to dostajemy stąd równanie zatem skąd wnioskujemy, że Identyczne rozumowanie stosuje się do i prowadzi ono do analogicznego rezultatu, z zastąpionym przez