Rozbijanie sieci terrorystycznych za pomocą teorii gier
Mimo licznych działań skierowanych na zwalczanie terroryzmu wiele organizacji terrorystycznych wciąż się powiększa. Aby poradzić sobie z tym problemem, agencje bezpieczeństwa poszukują nowych sposobów analizy pozwalających lepiej zrozumieć strukturę tych organizacji. Jednym z problemów jest zidentyfikowanie kluczowych członków organizacji terrorystycznej przy użyciu informacji jedynie o tym, jak wygląda sieć terrorystyczna - dzięki temu agencje bezpieczeństwa mogłyby skupić swoje ograniczone zasoby na tych jednostkach. W tym artykule omówimy nowe podejście do tego problemu oparte na teorii gier.
Zaczniemy jednak od przeglądu standardowych metod, które niedawno wprowadzone zostały do IBM i2 Analyst's Notebook - oprogramowania używanego przez organy ścigania i agencje wywiadowcze na całym świecie.
Podstawowe miary centralności
Wyobraź sobie, Czytelniku, że pracujesz w Centrum Antyterrorystycznym ABW, a na Twojej korkowej tablicy znajdują się zdjęcia 19 terrorystów połączonych sznurkami tak jak na rysunku. Każdy sznurek określa połączenie pomiędzy dwoma terrorystami - takie połączenie może oznaczać kontakt (np. rozmowę telefoniczną) między nimi, o którym wiedzą służby, lub więzi rodzinne. Twoim zadaniem jest wybranie terrorysty, któremu agencja założy podsłuch. Którego terrorystę wskażesz?
Trochę bardziej formalnie - nasza sieć to (nieskierowany) graf, czyli para w której oznacza zbiór wierzchołków (terrorystów), a to nasze połączenia (sznurki), czyli zbiór krawędzi. Krawędź pomiędzy wierzchołkami i oznaczamy przez (jest to zatem nieuporządkowana para). Naszym celem jest określenie, jak ważny jest każdy wierzchołek, czyli przypisanie każdemu pewnej liczby rzeczywistej Takie przypisanie, czyli formalnie funkcję, nazwiemy miarą centralności. Miary centralności mają szereg zastosowań od tak odległych jak wyznaczanie najbardziej wpływowych osób w sieciach społecznych, przez kluczowe węzły w infrastrukturze drogowej czy informatycznej, aż po analizę istotności genów w sieciach biologicznych.
Wróćmy jednak do naszego przykładu. Jak wybrać terrorystę, którego będziemy podsłuchiwać? Jeżeli zależałoby nam po prostu na zmaksymalizowaniu liczby podsłuchanych osób, powinniśmy wybrać osobę z największą liczbą połączeń. Miara oceniająca wierzchołek ze względu na ilość jego krawędzi nazywana jest miarą stopnia wierzchołka (degree centrality):
Na rysunku jest to Nawaf Alhazmi (5), który ma połączenie z aż siedmioma innymi osobami. Zwróćmy jednak uwagę, że wybierając tego terrorystę, rzeczywiście nagramy dużo osób, ale uzyskane informacje mogą mało znaczyć. Prezydent ma bezpośredni kontakt z mniejszą liczbą osób niż sprzedawca w McDonaldzie.
Zastanówmy się teraz, jak przechwycić losową informację krążącą po sieci terrorystycznej. Najlepsza pod tym względem jest osoba, która jest w centralnym punkcie sieci. Jak bardzo dany wierzchołek jest w centrum, możemy zmierzyć, patrząc na to, jak daleko jest od innych wierzchołków.
Odległość wierzchołka od definiujemy w grafie, mierząc najkrótszą ścieżkę między nimi, czyli licząc, ilu krawędzi musimy użyć, aby dotrzeć z do Miara oparta na tej idei nazywa się miarą bliskości (closeness centrality):
gdzie to odległość wierzchołka od Powyżej wzięliśmy odwrotność sumy odległości, a zatem wierzchołek, który jest blisko innych, będzie miał tę wartość wysoką, a ten położony na obrzeżach - niską. Miara bliskości zastosowana do naszej sieci z rysunku po raz kolejny wskazuje Nawafa Alhazmiego (5), ale tym razem jest on ex aequo z Mohamedem Attą (14) (obaj uzyskali wartość 1/35).
Powyższy sposób jest skuteczny, jeżeli informacje krążą losowo. Zastanówmy się jednak, kto najczęściej będzie na szlaku informacji. Załóżmy, że wierzchołek chce przekazać pewną informację wierzchołkowi Najlepiej, żeby informacja dostała się do jak najszybciej i jak najbezpieczniej (lepiej nie wtajemniczać osób, których nie trzeba), w związku z tym założymy, że porusza się ona po najkrótszej ścieżce. Najkrótszych ścieżek może być jednak kilka. Np. na rysunku Mohamed Atta (14) może dostarczyć informację do Salema Alhazmiego (8) przez Ziada Jarraha (11) albo przez Marwana Al-Shehhiego (15). Możemy jednak powiedzieć, że skoro Ziad Jarrah (11) należy do połowy najkrótszych ścieżek pomiędzy (14) i (8), to przechwyci połowę informacji wysyłanych między nimi. Rozważając wszystkie pary, które mogą wysyłać do siebie informacje i dodając te liczby, otrzymujemy miarę pośrednictwa (po angielsku betweenness centrality):
gdzie oznacza zbiór najkrótszych ścieżek pomiędzy a A zatem w mianowniku mamy liczbę wszystkich najkrótszych ścieżek pomiędzy a a w liczniku - liczbę takich ścieżek z wierzchołkiem Obliczenie miary pośrednictwa dla naszego grafu wymaga już trochę pracy. Kiedy to zrobimy, po raz kolejny okaże się, że wygrał Nawaf Alhazmi (5). Na drugim miejscu znajduje się jednak Abdul Aziz Al-Omari (16), który klasyfikowany jest nisko według innych miar - nie ma ani dużo połączeń, ani nie jest w centrum sieci. Czemu znalazł się on tak wysoko?
Wierzchołek ten jest wierzchołkiem rozcinającym, czyli ma taką wyjątkową cechę, że jego usunięcie powoduje, iż graf przestaje być połączony (spójny) i sieć traci możliwość koordynacji. Analitycy sieci terrorystycznych wskazują, że osoby takie odgrywają kluczową rolę w sieci, będąc na złączeniu wielu grup potrzebnych do przeprowadzenia ataku. Wyeliminowanie takich osób może najbardziej przyczynić się do rozbicia sieci terrorystycznej.
Miara łączenia grafu
Oprócz Abdula Aziza Al-Omariego (15) istnieją tylko trzy inne wierzchołki rozcinające: są to Hamza Alghamdi (4), Hani Hanjour (10) oraz Waleed Alshehri (17). Jeśli przyjmiemy to kryterium, reszta wierzchołków pozostaje nierozpoznawalna. W gęstszych grafach, tzn. grafach z większą ilością krawędzi przy tej samej ilości wierzchołków, często nie ma żadnego rozcinającego wierzchołka, tzn. usunięcie żadnego pojedynczego wierzchołka nie prowadzi do rozspójnienia grafu. Jak wówczas znaleźć wierzchołek najważniejszy w utrzymywaniu jego spójności?
W tym celu zamiast rozpatrywać pojedyncze wierzchołki musimy patrzeć na całe ich grupy. Grupy będziemy oceniać według tego, czy potrafią komunikować się bez pozostałych wierzchołków, czy nie, tzn. czy po usunięciu pozostałych wierzchołków z grafu będzie on spójny. W najprostszej wersji moglibyśmy przypisać grupie wartość 1, jeżeli jest ona spójna i 0 w przeciwnym przypadku. My postąpimy trochę mądrzej i weźmiemy pod uwagę, jak bardzo niespójna jest grupa: wartość 0 dostanie, jeżeli wszyscy jej członkowie są osobno, 1 - jeżeli dokładnie jedna para jest połączona itd. W rezultacie spójna grupa wierzchołków otrzyma wartość Bardziej formalnie - wartość grupy wierzchołków określamy równaniem
gdzie to liczba jej komponentów, czyli spójnych części. Przykładowo na rysunku trzyosobowa grupa osób o nazwisku Alshehri (7, 17, 18) otrzyma wartość 1, a równie liczna rodzina Alghamdich (1, 3, 4) wartość 2. Jak wyznaczyć jednak teraz, kto najbardziej przykłada się do łączenia grafu? Z pomocą przychodzi nam teoria gier, a konkretniej gry koalicyjne. Jak się zaraz okaże, powyższy problem oceny ważności w grafie zamieniliśmy na problem oceny ważności graczy w grze koalicyjnej...
Gry koalicyjne na ratunek!
Gra koalicyjna to para gdzie to zbiór graczy, a to tak zwana funkcja charakterystyczna, która każdej niepustej grupie graczy przypisuje pewną liczbę rzeczywistą, będącą ich wypłatą (formalnie przy czym zbiór pusty ma wartość 0: ). W grze koalicyjnej grupy nazywamy koalicjami. Gry koalicyjne używane są w ekonomii np. do modelowania rynków, a w informatyce stanowią popularny model kooperacji agentów w systemach wieloagentowych.
Podstawowym problemem w grze koalicyjnej jest następujące pytanie. Załóżmy, że wszyscy gracze będą razem współpracować i utworzą koalicję Jak teraz powinni podzielić się wspólną wypłatą? Przykładowo, niech firma sprzedaje lody po 4 złote, a firma sprzedaje patyki po 2 złote. Jeżeli firmy te się połączą, będą sprzedawać lody na patyku za 12 złotych. Jak powinny podzielić się tymi 12 złotymi?
Najsłynniejszą metodę rozwiązania tego problemu podał Lloyd Shapley, amerykański uczony i laureat Nagrody Nobla z ekonomii. Shapley zaproponował, aby oceniać gracza, patrząc na to, jaki jest jego wkład do różnych koalicji. Tak zwany wkład marginalny gracza do koalicji definiujemy jako różnicę pomiędzy wartością koalicji z graczem i bez niego: W oparciu o to pojęcie Shapley zaproponował następującą procedurę obliczania uczciwego udziału gracza we wspólnej wypłacie. Ustalmy pewną permutację czyli kolejność, w jakiej gracze dołączają do gry. Każdy kolejny gracz zwiększa wartość już istniejących graczy o swój wkład marginalny. W szczególności jeżeli przez oznaczymy zbiór graczy, którzy występują w permutacji przed graczem gracz wnosi wartość Teraz uczciwa wypłata gracza to średni wkład marginalny po wszystkich możliwych permutacjach:
gdzie to zbiór wszystkich permutacji zbioru
Ta metoda podziału nazywana jest wartością Shapleya. Mimo że może się ona wydawać arbitralna, Shapley pokazał, że jest to jedyny liniowy sposób podziału całej wypłaty w sposób, który symetrycznym graczom przypisuje taką samą wartość, a graczom, którzy nie wnoszą nic do żadnej koalicji, nie daje nic. Wartość Shapleya w przykładzie powyżej da firmie (od lodów) złotych, a firmie (od patyków) złotych.
Użyjemy teraz wartości Shapleya do znalezienia wierzchołka najistotniejszego z punktu widzenia utrzymywania spójności grafu. Naszym zbiorem graczy są teraz wierzchołki grafu, a funkcją oceniającą koalicje Nasza gra to zatem Zastosowanie wzoru na wartość Shapleya da nam następujący wynik:
Wkład marginalny wierzchołka do koalicji jest zatem równy różnicy ilości połączonych grup (komponentów), która była bez a będzie z graczem plus jeden. Jest to zatem ilość komponentów z z którymi jest połączony: jeżeli nie będzie połączony, zwiększy liczbę komponentów o 1 i otrzyma 0. Jeżeli złączy trzy grupy w jedną - otrzyma wartość 3. Tak jak chcieliśmy: gracz jest rzeczywiście oceniany w zależności od tego, jak dobry jest w łączeniu grafu!
Wyniki, jakie otrzymujemy według tej miary, są zupełnie inne niż z podstawowych miar, a niechlubny zwycięzca poprzednich miar - Nawaf Alhazmi (5) - jest u nas dopiero szósty. Na pierwszym miejscu znajduje się Hani Hanjour (10), którego usunięcie odłącza Majeda Moqed (13) z sieci. Widzimy także, że jego sąsiedzi są dość słabo połączeni, dlatego często jest on łącznikiem pomiędzy nimi. Drugie i trzecie miejsce zajmują Hamza Alghamdi (4) oraz Marwan Al-Shehhi (15) - dwaj terroryści w całości odpowiedzialni za jeden z samolotów - bez nich pozostali trzej terroryści z tego samolotu nie byliby w ogóle połączeni z siecią terrorystyczną. Czwartą wartość otrzymał Abdul Aziz Al-Omari (16) - wspomniany już terrorysta, który kontroluje "najniższy" na rysunku samolot. Piąty z kolei jest jego łącznik z kolejną dwójką - Waleed Alshehri (17). Wszystkie cztery wierzchołki rozcinające znalazły się zatem w pierwszej piątce naszego nowego rankingu - o to nam właśnie chodziło.
Sprytne użycie gier koalicyjnych pozwoliło nam zatem uzyskać pewien ranking oceniający wierzchołki według tego, jak ważne są w utrzymywaniu spójności grafu. Nie w każdej sieci ta miara będzie wskazywać najważniejsze wierzchołki i wyników tych nie można traktować jako twardych dowodów. Jest to jednak kolejna poszlaka, która w połączeniu z innymi może kiedyś pomóc agencjom bezpieczeństwa w udaremnieniu kolejnego ataku terrorystycznego.