Przeskocz do treści

Delta mi!

Ilu mamy przodków?

Piotr Różański

o artykule ...

  • Publikacja w Delcie: kwiecień 2011
  • Publikacja elektroniczna: 31-03-2011
  • Autor: Piotr Różański
    Afiliacja: student, Uniwersytet Mikołaja Kopernika

Jak wiadomo, każdy człowiek ma dwoje rodziców. Skoro każdy z rodziców też jest człowiekiem, ta rekurencyjna zależność pozwala w prosty sposób wyznaczyć liczbę przodków dowolnej osoby w linii prostej w kolejnych pokoleniach: czworo babć i dziadków, ośmioro prababć i pradziadków, a zatem ogólnie math dziadków obojga płci mamy math

obrazek



Na nieszczęście, powyższa zależność w dłuższym przedziale czasu prowadzi do paradoksu: jak bowiem możemy mieć ponad miliard przodków w trzydziestym pokoleniu, jeśli przewidywana liczba ludności świata w tym okresie (około roku 1300 n.e.) nie przekraczała 500 milionów? Aby wyjaśnić ten paradoks, wystarczy zauważyć, że w każdej ilościowo ograniczonej populacji pary zawsze tworzone są pomiędzy osobami spokrewnionymi, choćby w minimalnym stopniu. W związku z tym każdy ze wspólnych przodków tej pary będzie liczony dwukrotnie w drzewie genealogicznym każdego z jej potomków. Przy rozpatrywaniu wielu pokoleń (a więc wielkiej liczby przodków) zjawisko to zdarza się bardzo często.

Niestety, wyjaśnienie to nie zbliża nas do ilościowej odpowiedzi na zadane w tytule pytanie. Aby takiej odpowiedzi udzielić, należy dokonać pewnych założeń dotyczących przyjętego modelu populacji i dziedziczenia.

Założenia modelu

Pierwszym uproszczeniem, którego dokonamy, modelując populację, będzie podzielenie jej na pokolenia. Zakładamy, że pary czy też związki mogą być zawierane tylko przez osoby należące do tego samego pokolenia. Dzięki temu ciągłe zagadnienie modelowania liczby ludności sprowadza się do zagadnienia dyskretnego. Przyjmiemy ponadto, że tworzone pary są ściśle monogamiczne oraz niezmienne. W rozpatrywanym modelu zakładamy, że pary tworzone są w sposób losowy wewnątrz pokolenia, pomijać natomiast będziemy osoby niewchodzące w skład żadnej pary.

Dzięki przyjętym założeniom możemy za podstawową jednostkę modelu przyjąć nie pojedynczą osobę, lecz parę złożoną z dwóch osób przeciwnej płci. W tym ujęciu każda jednostka (para) pochodzi od dwóch jednostek (dwóch par rodziców) z poprzedniego pokolenia. Dzięki takiemu przedstawieniu sytuacji całkowicie unikamy problemów związanych z kategorią płci jako takiej. Od tego momentu (do odwołania) określenia „potomek” oraz „rodzic” będą dotyczyć jednostek, czyli de facto par.

„Magiczne” założenie

Dotychczasowe założenia modelu wynikały w naturalny sposób z określonych wniosków dotyczących realnego świata. Dla odmiany, ostatnie przyjęte w modelu założenie będzie jego cechą charakterystyczną. Nazywamy je „magicznym”, ponieważ mimo pozornie trywialnej treści ma znaczące konsekwencje. Oto ono:

dopasowania rodziców dla poszczególnych dzieci są od siebie niezależne.

Jak to rozumieć? Wyobraźmy sobie, że w pokoleniu dzieci wskazujemy dwie jednostki i oznaczamy je jako A i B. W tym momencie rodziców A może stanowić z równym prawdopodobieństwem każda nieuporządkowana dwójka jednostek z pokolenia rodziców. Istota założenia polega na tym, że niezależnie od wskazania rodziców dla jednostki A wybór rodziców dla jednostki B nadal jest losowy z równym prawdopodobieństwem dla każdej dwójki.

obrazek

Rys. 1 Rozkład dzietności math przy stałej liczebności populacji math

Rys. 1 Rozkład dzietności math przy stałej liczebności populacji math

Okazuje się, że przy takich założeniach jedynymi parametrami modelu są liczebności poszczególnych pokoleń. W szczególności, znając liczebność pokolenia rodziców ( math) i liczebność pokolenia dzieci ( math ), można wyznaczyć strukturę dzietności, czyli rozkład zmiennej losowej math opisującej liczbę potomków wybranej jednostki z pokolenia rodziców. Otrzymany wynik ma postać rozkładu dwumianowego z ilością prób równą math  i parametrem math Biorąc pod uwagę, że liczebności populacji są zwykle dość duże, dobrym przybliżeniem tego rozkładu staje się rozkład Poissona z parametrem math Rozkład w szczególnym przypadku populacji o stałej liczebności (dla math) przedstawiony jest na wykresie.

Funkcja przejścia

Założenia modelu mówią, że każda jednostka pochodzi od dwóch rodziców. Zastanówmy się w takim razie, od ilu rodziców pochodzą dwie jednostki? Naturalna wydaje się odpowiedź: „od czterech”, ale przecież zachodzi to tylko wtedy, gdy jednostki te nie mają wspólnych rodziców.

Rozważmy bardziej ogólną sytuację, w której spośród pokolenia dzieci wybieramy math jednostek i badamy wartość math – moc zbioru rodziców wybranych dzieci. Rozwiązaniem tego zagadnienia dla zadanego math jest zmienna losowa o rozkładzie math przyjmującym niezerowe wartości jedynie dla math

Rozkłady math wyznaczone kombinatorycznie i zapisane w postaci rekurencyjnej, nie wyglądają zachęcająco:

display-math

Jak się jednak okazuje po prostym badaniu metodami numerycznymi, każdy z nich przyjmuje znacząco niezerowe wartości tylko w niewielkim przedziale otaczającym maksimum. Na dodatek, szerokość tego przedziału zmniejsza się szybko wraz ze wzrostem liczebności populacji. Wobec tego przybliżymy poszczególne rozkłady math rozkładami jednopunktowymi zlokalizowanymi w maksimach – położenia owych maksimów oznaczmy przez math Będziemy zatem poszukiwać wartości math w zależności od parametru math rozkładu. Poszukiwana funkcja math ma tutaj bardzo sensowną interpretację: jest to oczekiwana liczba rodziców dla math jednostek z pokolenia dzieci.

Wróćmy na chwilę do zmiennej losowej math przedstawiającej strukturę dzietności populacji. Zauważmy najpierw, że bezpośrednio z rozkładu tej zmiennej możemy odczytać wartość math  czyli przewidywaną liczbę rodziców całego pokolenia. Wartość ta będzie równa

display-math

Następnie zauważmy, że jeśli z pokolenia dzieci wyodrębnimy math jednostek, to (na podstawie „magicznego” założenia) jakiekolwiek przyporządkowania dokonane dla nich będą niezależne od przyporządkowań dla pozostałych jednostek. Zatem, wynik dla math jednostek wybranych z pokolenia o liczebności math  czyli math powinien być taki sam, jak wynik dla całego pokolenia o liczebności math Na mocy tej obserwacji otrzymujemy

display-math

Można sprawdzić, że dla odpowiednio licznych populacji ( math dużo większe od math) jest math

Zliczanie

Aby policzyć przodków z poszczególnych pokoleń, musimy przyjąć określony model liczebności. Powracając do liczenia osób, a nie par, określić należy ciąg math  wyrażający liczebności poszczególnych pokoleń (liczonych wstecz). Analogicznie, przez math oznaczmy liczby przodków kolejnych stopni (rodziców, dziadków, pradziadków…). Zauważmy, że dla dowolnego math przy rozpatrywaniu związku pomiędzy pokoleniami math i math liczba par z pokolenia dzieci równa jest math  liczba zaś par rodziców math Jednocześnie, liczba wszystkich par z pokolenia rodziców, czyli math wynosi math  Zatem, korzystając z obliczonej poprzednio postaci funkcji math mamy

display-math

dla dowolnego math

Dodatkowo, biorąc pod uwagę, że mamy dwoje rodziców ( math), oraz podstawiając do powyższego wzoru jawną postać funkcji math możemy napisać następującą rekurencję:

display-math

Jednoparametrowy model liczebności

Przyjmując prosty model liczebności opisany jednym parametrem math można jakościowo scharakteryzować wyniki otrzymane przez numeryczne rozwiązanie powyższej rekurencji. Wyróżniamy trzy fazy:

  • faza wzrostu wykładniczego dla najbliższych pokoleń, w której math;
  • faza przejściowa, w której math występująca w okolicy math ;
  • faza nasycenia charakteryzująca się stałym ilorazem (współczynnikiem nasycenia) math
obrazek

Rys. 2 Wyniki dla modelu jednoparametrowego z math  oraz math

Rys. 2 Wyniki dla modelu jednoparametrowego z math  oraz math

Współczynnik nasycenia w powyższym modelu można obliczyć, szukając granicy ciągu math a więc rozwiązując równanie

display-math

Przy populacji o stałej liczebności ( math) współczynnik ten osiąga wartość math Oznacza to, że dla takiej populacji w odległych pokoleniach przodkowie stanowią niezmiennie prawie 80% całego pokolenia.

Co poza tym?

Nie da się nie zauważyć, że przedstawiony tu model obliczeń jest znacząco uproszczony. Dla rzeczywistych, dużych populacji, dobór osób w pary nie odbywa się całkowicie losowo, lecz zazwyczaj istnieje skłonność do szukania partnerów wśród bliższego otoczenia. Uzasadnione więc byłoby wyodrębnienie grup wewnątrz populacji, dopuszczając jednocześnie (z określonym prawdopodobieństwem) możliwość krzyżowania pomiędzy grupami. Ponadto, podział na pokolenia nie jest do końca naturalny, szczególnie w populacjach, w których nie obowiązują ścisłe reguły (np. kulturowe) dotyczące różnic wieku.

Bardziej złożony model, uwzględniający rzeczywiste migracje ludności i izolacje poszczególnych grup (geograficzne, językowe…), wykorzystali Rohde, Olson i Chang w swoim artykule Modelling the recent common ancestry of all living humans opublikowanym w Nature. Oszacowali oni czas pojawienia się tzw. Ostatniego Wspólnego Przodka wszystkich obecnie żyjących ludzi na Ziemi na pierwsze lub drugie tysiąclecie p.n.e. Genealodzy, do pracy!