Drzewo Steinera: jedno zagadnienie, mnóstwo problemów

W naszym zespole badawczym analizujemy wiele różnych zagadnień, które występują w różnych aspektach. Nic w tym dziwnego, wszak algorytmika jest bardzo szeroką dziedziną. Zdarza się i tak, że to samo zagadnienie pojawia się w wielu kontekstach. Taka sytuacja ma miejsce w przypadku problemu drzewa Steinera.

Rys. 1 Punkt $\text{[math]}$ jest punktem Steinera dla wierzchołków $\text{[math]}$

Zanim przejdziemy do formalnej definicji, przyjrzyjmy się nastepującemu klasycznemu problemowi geometrycznemu. Książę Piotruś jest władcą trzech miast: $\text{[math]}$ $\text{[math]}$ i $\text{[math]}$ Chce je połączyć drogami tak, by z każdego miasta dało się dojechać do każdego innego, i oczywiście pragnie zminimalizować koszt budowy, czyli sumę długości zbudowanych dróg. Jedną z dostępnych opcji jest zbudowanie dróg wzdłuż dwóch krótszych boków trójkąta $\text{[math]}$ Jednak, co dla niektórych Czytelników może być zaskakujące, można lepiej! O ile tylko każdy kąt wewnętrzny trójkąta $\text{[math]}$ ma miarę mniejszą niż $\text{[math]}$ taniej jest zrobić tak: znajdujemy wewnątrz trójkąta $\text{[math]}$ punkt $\text{[math]}$ taki że $\text{[math]}$ i budujemy drogi $\text{[math]}$ $\text{[math]}$ i $\text{[math]}$ Czasem więc opłaca się wyjść poza schemat prowadzenia dróg bezpośrednio między miastami i zbudować dodatkowe skrzyżowanie. To dodatkowe skrzyżowanie nazywa się często punktem Steinera.

Przełóżmy teraz problem księcia Piotrusia na język teorii grafów. Mamy dany spójny graf nieskierowany $\text{[math]}$ w którym każda krawędź $\text{[math]}$ ma swoją długość $\text{[math]}$ Graf to cały świat księcia Piotrusia: wierzchołki grafu odpowiadają możliwym skrzyżowaniom, a krawędzie możliwym drogom. Księstwo księcia Piotrusia to podzbiór wierzchołków $\text{[math]}$ : te wierzchołki reprezentują miasta, które chcemy połączyć drogami. Mamy znaleźć najtańszą sieć dróg – czyli spójny podgraf grafu $\text{[math]}$ – która łączy wszystkie miasta – czyli wierzchołki zbioru $\text{[math]}$ Zauważmy, że ten najtańszy podgraf zawsze będzie drzewem. Zbiór $\text{[math]}$ często nazywa się zbiorem terminali. Tak określone zagadnienie to problem znalezienia najtańszego drzewa Steinera dla zbioru terminali $\text{[math]}$ Przykładowy graf z czterema terminalami znajduje się na rysunku 2.

Będziemy też czasem mówili o problemie drzewa Steinera bez długości; wtedy zakładamy, że każda krawędź grafu ma długość jeden. Zauważmy, że odpowiada to znalezieniu jak najmniejszego zbioru wierzchołków $\text{[math]}$ tak, by zbiór $\text{[math]}$ indukował spójny podgraf grafu $\text{[math]}$ tzn. aby krawędzie, których oba końce znajdują się w tym zbiorze, wystarczały do tego, aby z każdego terminalu dało się dojść do każdego innego terminalu. Zbiór $\text{[math]}$ reprezentuje dodatkowe wierzchołki poza $\text{[math]}$ w poszukiwanym drzewie Steinera. Jeśli weźmiemy $\text{[math]}$ dodatkowych wierzchołków, to drzewo rozpinające $\text{[math]}$ będzie miało $\text{[math]}$ krawędzi i taki sam będzie koszt budowy dróg, co oznacza, że minimalizując $\text{[math]}$ minimalizujemy sumę długości krawędzi wybranych do drzewa Steinera.

Problem drzewa Steinera, nawet w wersji bez długości, jest NP-trudny, co oznacza, że najprawdopodobniej nie da się efektywnie znajdować optymalnych rozwiązań tego zagadnienia. Wobec tego będziemy próbowali radzić sobie z nim w dwojaki sposób: dla większych instancji (tj. większych danych wejściowych problemu) wystarczy nam rozwiązanie przybliżone, natomiast rozwiązanie dokładne będziemy znajdować w czasie wykładniczym dla grafów na tyle dużych, na ile pozwoli nam złożoność naszego algorytmu oraz moc obliczeniowa komputera.

Zacznijmy od najbardziej klasycznej metody radzenia sobie z problemami NP-trudnymi, czyli od algorytmów aproksymacyjnych. Chcemy szybko – w czasie wielomianowym od rozmiaru grafu – znaleźć drzewo Steinera, które niekoniecznie będzie najlepsze, ale będzie niewiele gorsze od optymalnego.

Aby otrzymać prosty algorytm aproksymacyjny, wróćmy do oryginalnego problemu księcia Piotrusia na płaszczyźnie. Wymyślenie, by dodać punkt $\text{[math]}$ było dość trudne. A o ile gorzej byłoby, gdyby książę Piotruś zbudował drogi wzdłuż dwóch krótszych boków trójkąta $\text{[math]}$ ? Otóż okazuje się, że niewiele gorzej.

Przeanalizujmy ten pomysł w języku teorii grafów. Zmierzmy najkrótsze odległości między każdą parą miast. Zbudujmy graf pełny $\text{[math]}$ o zbiorze wierzchołków $\text{[math]}$ Dla miast $\text{[math]}$ jako długość krawędzi $\text{[math]}$ przyjmijmy długość najkrótszej ścieżki między $\text{[math]}$ i $\text{[math]}$ w grafie $\text{[math]}$ Graf $\text{[math]}$ odpowiada grafowi składającemu się z boków trójkąta $\text{[math]}$ w rozpatrywanym na początku problemie na płaszczyźnie, przy założeniu, że robotnicy księcia Piotrusia nie potrafią budować dodatkowych skrzyżowań, ale potrafią budować najkrótsze drogi między każdą parą miast. W grafie $\text{[math]}$ znajdźmy minimalne drzewo rozpinające $\text{[math]}$ – można to zrobić wielomianowo za pomocą jednego z klasycznych algorytmów, np. Kruskala lub Prima. Następnie dla każdej krawędzi $\text{[math]}$ drzewa $\text{[math]}$ w grafie $\text{[math]}$ zbudujmy ciąg dróg odpowiadający najkrótszej ścieżce między $\text{[math]}$ i $\text{[math]}$ W ten sposób w $\text{[math]}$ połączymy wszystkie miasta. Zauważmy, że możliwa jest sytuacja, w której jedną drogę (krawędź oryginalnego grafu) będziemy chcieli wybudować więcej niż raz, gdyż była ona częścią kilku najkrótszych ścieżek wybranych do drzewa rozpinającego. Jednakże w takim wypadku uzyskane drzewo Steinera będzie tańsze niż drzewo $\text{[math]}$ więc jest to dla nas sytuacja jak najbardziej korzystna. Zastanówmy się, o ile droższe może być drzewo $\text{[math]}$ od rozwiązania optymalnego?

Niech $\text{[math]}$ będzie optymalnym drzewem Steinera. Wykonujemy następującą operację, kluczową dla całej analizy, mianowicie podwajamy krawędzie drzewa $\text{[math]}$ W ten sposób otrzymujemy graf spójny, w którym każdy wierzchołek ma stopień parzysty. Ma on więc cykl Eulera o długości równej dwukrotności kosztu drzewa $\text{[math]}$ Zauważmy, że fragmenty cyklu prowadzące pomiędzy kolejnymi terminalami mają długości co najmniej takie, jak długości odpowiednich krawędzi w grafie $\text{[math]}$ gdyż długości krawędzi w grafie $\text{[math]}$ odpowiadają najkrótszym ścieżkom w $\text{[math]}$ Zatem podwojony koszt drzewa $\text{[math]}$ jest nie mniejszy niż koszt pewnego zbioru krawędzi $\text{[math]}$ rozpinającego graf $\text{[math]}$ który to koszt jest z kolei nie mniejszy niż koszt drzewa $\text{[math]}$ które jest minimalnym drzewem rozpinającym w grafie $\text{[math]}$ Stąd, nasz algorytm aproksymacyjny znajdzie drzewo Steinera o koszcie nie większym niż dwukrotność kosztu optymalnego drzewa Steinera.

A czy da się lepiej? To znaczy, czy w czasie wielomianowym możliwe jest skonstruowanie drzewa Steinera, którego koszt będzie mniejszy niż dwukrotność optymalnego rozwiązania?

Okazuje się, że próbując lokalnie poprawiać otrzymane drzewo, np. starając się wybierać wierzchołki Steinera o stopniu $\text{[math]}$ można otrzymać trochę lepszy współczynnik aproksymacji (największy iloraz znalezionego przez nas rozwiązania oraz rozwiązania optymalnego). Najlepszy aktualnie znany algorytm aproksymacyjny dla problemu drzewa Steinera znajduje zawsze rozwiązanie nie gorsze niż 1,39 optymalnego kosztu. Algorytm ten pochodzi z 2010 roku, a jednym z jego autorów jest Jarosław Byrka z Uniwersytetu Wrocławskiego.

Na dziś starczy algorytmów aproksymacyjnych. Teraz będziemy próbowali rozwiązać problem drzewa Steinera w sposób dokładny, lecz w wersji bez długości. W tym sformułowaniu problem przejawia naturę kombinatoryczną.

Uporządkowanym etykietowanym drzewem nazwiemy drzewo z wyróżnionym korzeniem, w którym zbiór synów każdego wierzchołka jest uporządkowany (tzn. ich kolejność ma znaczenie). Każdy wierzchołek takiego drzewa ma etykietę będącą identyfikatorem wierzchołka z grafu $\text{[math]}$ Aby uporządkowane etykietowane drzewo $\text{[math]}$ było poprawne, musi być spełniony warunek, że jeśli w drzewie $\text{[math]}$ mamy krawędź łączącą wierzchołki o etykietach $\text{[math]}$ to w grafie $\text{[math]}$ istnieje krawędź $\text{[math]}$ Zauważmy, że nie wymagamy, aby etykiety wierzchołków drzewa były różne, jednakże etykieta każdego wierzchołka jest różna od etykiety ojca, gdyż w grafie $\text{[math]}$ nie ma pętli.

Zauważmy, że jeśli w grafie $\text{[math]}$ istnieje uporządkowane etykietowane drzewo $\text{[math]}$ którego zbiór etykiet zawiera identyfikatory wszystkich terminali, to optymalne drzewo Steinera ma nie więcej niż $\text{[math]}$ wierzchołków, gdyż możemy użyć drzewa $\text{[math]}$ do konstrukcji zbioru dróg, które rozpinają cały zbiór terminali.

Wygodniej będzie, gdy zamienimy problem optymalizacyjny, jakim jest poszukiwanie minimalnej liczby wierzchołków w drzewie Steinera, na problem decyzyjny, w którym mamy stwierdzić, czy w danym grafie istnieje drzewo Steinera zawierające nie więcej niż $\text{[math]}$ wierzchołków. Zamiast szukać drzewa Steinera, będziemy szukać uporządkowanego etykietowanego drzewa $\text{[math]}$ którego zbiór etykiet zawiera wszystkie identyfikatory terminali ze zbioru $\text{[math]}$ Okazuje się jednak, że dużo łatwiej szuka się drzewa, które nie zawiera pewnych etykiet, dlatego też użyjemy zasady włączeń i wyłączeń (czyli uogólnienia wzoru $\text{[math]}$ na większą liczbę zbiorów). Niech $\text{[math]}$ dla $\text{[math]}$ i $\text{[math]}$ oznacza liczbę uporządkowanych etykietowanych drzew o $\text{[math]}$ wierzchołkach, których zbiór etykiet nie zawiera identyfikatorów terminali ze zbioru $\text{[math]}$ Wartość $\text{[math]}$ dla ustalonych $\text{[math]}$ oraz $\text{[math]}$ można obliczyć w czasie wielomianowym standardowym algorytmem programowania dynamicznego, co pozostawiamy Drogiemu Czytelnikowi jako ćwiczenie. Zauważmy też, że na mocy zasady włączeń i wyłączeń liczba uporządkowanych drzew $\text{[math]}$ -wierzchołkowych zawierających wszystkie etykiety ze zbioru $\text{[math]}$ jest równa:

display-math

Skoro każdą wartość $\text{[math]}$ potrafimy obliczyć w czasie wielomianowym, to powyższą sumę możemy obliczyć w czasie $\text{[math]}$ przy czym przez $\text{[math]}$ oznaczamy czas wielomianowy względem $\text{[math]}$ Ten algorytm zaprezentował w 2009 roku Jesper Nederlof, a główną zaletą tej metody jest to, że zależność wykładnicza dotyczy jedynie $\text{[math]}$ a nie całego $\text{[math]}$ Pytaniem otwartym jest, czy da się to zrobić szybciej, np. w czasie $\text{[math]}$ dla jakiegoś $\text{[math]}$

W artykule Pokrycie wierzchołkowe kontratakuje (Delta 4/2010) przedstawiliśmy ideę kernelizacji. Algorytm kernelizacyjny to taki, który szybko (w czasie wielomianowym) istotnie zmniejsza rozmiar problemu w ten sposób, że dla zmniejszonej instancji wynik jest taki sam jak dla oryginalnej. Spróbujmy zrozumieć, czego oczekiwalibyśmy od algorytmu kernelizacyjnego dla problemu drzewa Steinera. Wejściem (decyzyjnej wersji) problemu drzewa Steinera bez długości jest graf $\text{[math]}$ zbiór terminali (miast) $\text{[math]}$ oraz liczba całkowita $\text{[math]}$ ; chcemy znaleźć drzewo $\text{[math]}$ o co najwyżej $\text{[math]}$ wierzchołkach, zawierające wszystkie terminale. Chcielibyśmy w czasie wielomianowym zredukować rozmiar grafu; powiedzmy, że oczekujemy, że po redukcji graf będzie wielkości wielomianowej względem $\text{[math]}$ Pokażemy, dlaczego jest to niemożliwe (przy odpowiednich założeniach teoriozłożonościowych).

Na chwilę przenieśmy się do innego zagadnienia. W problemie znajdowania motywu w grafie mamy dany graf $\text{[math]}$ w którym każdy wierzchołek jest pomalowany na jeden z $\text{[math]}$ kolorów. Chcemy wybrać po jednym wierzchołku każdego koloru tak, by wybrane wierzchołki tworzyły (indukowały) graf spójny. Taki zbiór wierzchołków nazywamy motywem. Co może wydać się zaskakujące, problem ten jest NP-trudny, nawet gdy $\text{[math]}$ jest drzewem, którego wszystkie wierzchołki mają stopień nie większy niż trzy.

Zauważmy, że problem drzewa Steinera jest co najmniej tak trudny jak problem znajdowania motywu w grafie. Faktycznie, istnieje sprowadzenie (redukcja) przekształcające instancje problemu znajdowania motywu w grafie na instancje problemu drzewa Steinera. Mając daną instancję problemu znajdowania motywu w grafie $\text{[math]}$ dla każdego koloru $\text{[math]}$ dodajemy terminal $\text{[math]}$ połączony ze wszystkimi wierzchołkami koloru $\text{[math]}$ Łatwo zauważyć, że drzewo Steinera o $\text{[math]}$ wierzchołkach w grafie $\text{[math]}$ z dodanymi terminalami odpowiada motywowi w oryginalnym grafie $\text{[math]}$ Jest tak dlatego, że dwa różne terminale nigdy nie mają wspólnego sąsiada, co oznacza, że do drzewa Steinera musimy wybrać co najmniej $\text{[math]}$ wierzchołków niebędących terminalami. Jednakże szukamy drzewa o co najwyżej $\text{[math]}$ wierzchołkach, co oznacza, że zbiór nieterminali, które wybierzemy do drzewa Steinera, musi być spójny, gdyż nie możemy sobie pozwolić na wybranie żadnego dodatkowego wierzchołka. Ten spójny zbiór nieterminali odpowiada motywowi w oryginalnym grafie, jako że sąsiedzi różnych terminali mają różne kolory.

Teraz załóżmy, że mamy algorytm kernelizacyjny dla problemu drzewa Steinera w grafie bez długości, tj. algorytm, który w czasie wielomianowym redukuje rozmiar grafu $\text{[math]}$ do wielkości wielomianowej od $\text{[math]}$ – liczby terminali w grafie. Możemy wtedy wykonać następującą operację:

1.: Załóżmy, że mamy dany długi ciąg instancji problemu znajdowania motywu w grafie $\text{[math]}$ ; każda instancja ma dokładnie $\text{[math]}$ kolorów.
2.: Tworzymy graf $\text{[math]}$ który jest sumą rozłączną wszystkich grafów $\text{[math]}$ $\text{[math]}$ Kolory wierzchołków są takie same jak w grafach $\text{[math]}$ Zauważmy, że w grafie $\text{[math]}$ istnieje motyw wtedy i tylko wtedy, gdy istnieje on w co najmniej jednym z grafów $\text{[math]}$ : motyw musi być spójny, więc musi zawierać się w jednej spójnej składowej grafu $\text{[math]}$
3.: Redukujemy problem znajdowania motywu w grafie $\text{[math]}$ do problemu znajdowania drzewa Steinera, tak jak w poprzednim akapicie: dodajemy po jednym terminalu każdego koloru. Otrzymujemy graf $\text{[math]}$ w którym szukamy drzewa Steinera o $\text{[math]}$ wierzchołkach.
4.: Na grafie $\text{[math]}$ uruchamiamy algorytm kernelizacyjny, który zmniejsza graf $\text{[math]}$ do rozmiarów wielomianowych względem $\text{[math]}$ (czyli wielomianowych względem $\text{[math]}$ ).

Przeanalizujmy, co się stało. Liczba początkowych instancji – $\text{[math]}$ – mogła być bardzo duża, ponadwielomianowa w stosunku do $\text{[math]}$ Na końcu otrzymaliśmy jedną instancję problemu znajdowania drzewa Steinera o dużo mniejszej liczbie wierzchołków – wielomianowej względem $\text{[math]}$ Przy tym ta końcowa instancja jest „syntezą” początkowych instancji: istnieje w niej odpowiednio małe drzewo Steinera wtedy i tylko wtedy, gdy co najmniej jedna początkowa instancja miała motyw. Końcowa instancja jest jednak bardzo mała i nie ma szans pomieścić informacji o wszystkich początkowych instancjach problemu znajdowania motywu w grafie – intuicyjnie oznacza to, że musieliśmy większość instancji $\text{[math]}$ w jakiś sposób rozwiązać. Okazuje się, że dla problemu NP-zupełnego taka operacja nie może nam się udać; powyższe rozumowanie można sformalizować i pokazać, że algorytm kernelizacyjny dla problemu drzewa Steinera pociągałby za sobą dużą rewolucję w teorii złożoności, co jest mało prawdopodobne. Dodajmy tylko, że użyta tutaj technika jest również stosunkowo nowa – pierwsi użyli jej Lance Fortnow i Rahul Santhanam w swojej pracy z 2008 roku.

Jak widać, problem drzewa Steinera ma wiele ciekawych obliczy i każdy znajdzie w nim coś dla siebie. Barwne jest życie algorytmika.

Do grupy naukowej badającej różne aspekty problemów NP-trudnych na wydziale Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego należą dr Łukasz Kowalik, dr Marcin Mucha, dr hab. Piotr Sankowski, dr Jakub Wojtaszczyk, a także doktoranci i studenci wydziału, w tym autorzy tego artykułu. Główne kierunki badań stanowią aproksymacja oraz algorytmy dokładne dla problemów NP-trudnych. Prace, których autorami są członkowie zespołu, są publikowane na najlepszych międzynarodowych konferencjach poświęconych informatyce teoretycznej oraz w uznanych periodykach naukowych. Członkowie grupy są laureatami programów stypendialnych Fundacji Nauki Polskiej, miesięcznika Polityka i nagród im. Witolda Lipskiego. Ponadto prace naukowe grupy badawczej prowadzone są w ramach grantów MNiSW, jak również prestiżowego grantu „Starting Independent Researcher Grant” ufundowanego przez European Research Council, którego kierownikiem jest dr hab. Piotr Sankowski.