Informatyk gra na giełdzie

Nasz znajomy informatyk zdecydował się zainwestować część swoich oszczędności na giełdzie papierów wartościowych. Jak na informatyka przystało, do grania na giełdzie postanowił zaprząc komputer. W tym celu, korzystając z najnowszych trendów sztucznej inteligencji, napisał program, który na podstawie przeszłych notowań giełdowych przewiduje, jak kurs akcji będzie się zmieniał w przyszłości, i podejmuje decyzje o kupnie bądź sprzedaży. Nasz znajomy przetestował program, uruchamiając go na dużym zbiorze archiwalnych notowań. Zastanawia się teraz, jak dobrze jego program sobie poradził – stanął zatem przed problemem wyznaczenia najlepszej możliwej gry na giełdzie, jeśli znamy wszystkie notowania.

Model gry na giełdzie będzie następujący. Mamy daną tablicę $\text{[math]}$ z notowaniami giełdowymi w kolejnych dniach: $\text{[math]}$ oznacza cenę jednej akcji w $\text{[math]}$ -tym dniu (dla uproszczenia przyjmiemy, że mamy tylko jeden rodzaj akcji). Na początku dysponujemy kwotą $\text{[math]}$ i możemy wykonać nie więcej niż $\text{[math]}$ operacji kupna-sprzedaży akcji (zakładamy, że możemy kupować ułamkową liczbę akcji). Zauważmy, że nie potrzebujemy wykonywać operacji równolegle (tzn. przed każdym kupnem opłaca się nam najpierw sprzedać wszystkie posiadane akcje). Ponadto warto też kupować akcje za całą dostępną kwotę. Z tego wynika, że jeśli pierwszą operację kupna przeprowadzimy w dniu $\text{[math]}$ a odpowiadającą jej sprzedaż w dniu $\text{[math]}$ to po tej operacji będziemy mieli kwotę $\text{[math]}$ Naszym celem jest zmaksymalizowanie kwoty po wszystkich $\text{[math]}$ operacjach, czyli iloczynu

display-math

Możemy pozbyć się mnożeń i dzieleń, logarytmując powyższy wzór. Innymi słowy, równoważnie możemy zmaksymalizować sumę

display-math

W końcu jeśli wprowadzimy pomocniczą tablicę $\text{[math]}$ która zawierać będzie zmiany zlogarytmowanych notowań, tzn. $\text{[math]}$ to nasze zadanie sprowadzi się do wybrania co najwyżej $\text{[math]}$ rozłącznych fragmentów $\text{[math]}$ które maksymalizują sumę liczb do nich należących (Rys. 1):

display-math

Dla $\text{[math]}$ jest to klasyczne zadanie znajdowania fragmentu tablicy o największej sumie, które może być znane Czytelnikom. Z kolei jego uogólnienie dla $\text{[math]}$ było treścią zadania pt. Tanie linie, które pojawiło się podczas weekendowej rundy Potyczek Algorytmicznych 2012. Oba problemy mają liczne ciekawe rozwiązania. W dalszej części artykułu przedstawimy, z pożytkiem dla znajomego informatyka, aż osiem z nich.

***

Na początek przypomnijmy, jak rozwiązać zadanie dla $\text{[math]}$ Algorytm A1 jest bardzo prosty: w czasie $\text{[math]}$ możemy przebadać wszystkie możliwe fragmenty, ustalając lewy koniec fragmentu i iterując po kolejnych możliwych prawych końcach.

Algorytm A2 wykona to samo w optymalnym czasie $\text{[math]}$ Przeglądamy elementy tablicy od lewej do prawej i trzymamy $\text{[math]}$ – maksymalny fragment w przedziale $\text{[math]}$ oraz $\text{[math]}$ – maksymalny fragment, który dotyka prawego końca tego przedziału (tzn. kończy się elementem $\text{[math]}$ ). Na początek $\text{[math]}$ i $\text{[math]}$ inicjujemy zerami, a następnie wykonujemy pętlę:

display-math

Zadanie dla $\text{[math]}$ można rozwiązać, korzystając z metody programowania dynamicznego i uogólniając algorytm A2. Przez $\text{[math]}$ oznaczmy największą sumę liczb z przedziału $\text{[math]}$ zawartych w co najwyżej $\text{[math]}$ rozłącznych fragmentach, a przez $\text{[math]}$ to samo, ale z zastrzeżeniem, że ostatni fragment zawiera element $\text{[math]}$ Rekurencja (bez uwzględniania warunków brzegowych) jest następująca:

$pict$

Rozwiązaniem jest $\text{[math]}$ ; algorytm A3 działa w czasie $\text{[math]}$

Poszukując szybszego algorytmu dla $\text{[math]}$ spróbujmy odpowiedzieć na pytanie: Czy, mając optymalne rozwiązanie dla $\text{[math]}$ fragmentów, da się je łatwo rozszerzyć do $\text{[math]}$ fragmentów? Zatrzymajmy się nad przypadkiem $\text{[math]}$ Powiedzmy, że fragment $\text{[math]}$ ma największą sumę. Jak może wyglądać optymalne rozwiązanie dla dwóch fragmentów $\text{[math]}$ Rozważmy dwa przypadki (Rys. 2).

(1) Jeden z fragmentów (powiedzmy $\text{[math]}$ ) jest rozłączny z $\text{[math]}$ Wtedy $\text{[math]}$ jest poprawnym rozwiązaniem, zatem z optymalności $\text{[math]}$ dostajemy, że $\text{[math]}$ Ale z optymalności $\text{[math]}$ mamy $\text{[math]}$ zatem fragmenty $\text{[math]}$ i $\text{[math]}$ mają tę samą sumę. To pokazuje, że $\text{[math]}$ jest również optymalne.
(2) Oba fragmenty $\text{[math]}$ przecinają $\text{[math]}$ Jeśli $\text{[math]}$ to fragment $\text{[math]}$ musi mieć sumę zero (inaczej moglibyśmy poprawić $\text{[math]}$ dodając do niego ten fragment, lub poprawić $\text{[math]}$ usuwając ten fragment). Zatem usunięcie tego fragmentu z $\text{[math]}$ nie zmieni wyniku. Analogicznie dla $\text{[math]}$ fragment $\text{[math]}$ musi mieć sumę zero i można go dodać do $\text{[math]}$ Stosując takie samo rozumowanie do prawego końca fragmentu $\text{[math]}$ dostajemy, że istnieje optymalne rozwiązanie $\text{[math]}$ w którym $\text{[math]}$ i $\text{[math]}$

Udowodniliśmy zatem, że możemy znaleźć optymalne rozwiązanie dla $\text{[math]}$ rozszerzając fragment $\text{[math]}$ o największej sumie. W tym celu: albo (1) dodajemy nowy fragment o największej sumie, który jest rozłączny z $\text{[math]}$ albo (2) znajdujemy fragment o najmniejszej sumie zawarty całkowicie w $\text{[math]}$ i usuwamy go, dzieląc $\text{[math]}$ na dwa fragmenty. Wybieramy ten wariant, który lepiej poprawia wynik.

Zachęceni tym sukcesem moglibyśmy wykonać trochę eksperymentów praktycznych i przekonać się, że pomysł ten działa dla dowolnego $\text{[math]}$ Niech $\text{[math]}$ to zbiór fragmentów o maksymalnej łącznej sumie, a $\text{[math]}$ to pozostałe części tablicy (Rys. 3). Aby uzyskać optymalne $\text{[math]}$ fragmentów, albo dołączamy maksymalny fragment, który jest zawarty w pewnym $\text{[math]}$ albo usuwamy minimalny fragment z pewnego $\text{[math]}$ Zachęcamy do próby dowodu poprawności tego rozwiązania. To może nie być proste, ale dla Czytelników Wytrwałych na końcu artykułu podamy wskazówkę, jak można się do tego zabrać.

Pozostaje kwestia efektywnej implementacji tego pomysłu. Jedną fazę możemy wykonać w czasie $\text{[math]}$ uruchamiając algorytm A2 na każdym przedziale osobno. Tak zapisany algorytm A4 będzie działał w czasie $\text{[math]}$ co nie daje nam jeszcze zysku w porównaniu z algorytmem A3. Widać, że kluczową operacją jest odpowiadanie na pytania „jaki jest maksymalny fragment w danym przedziale?” dla różnych przedziałów. Pokażemy teraz, jak to robić efektywnie.

W tym celu może nam pomóc jeszcze jeden algorytm dla $\text{[math]}$ Algorytm A5 będzie oparty o metodę „dziel i zwyciężaj”. Mając dany przedział o długości $\text{[math]}$ możemy go podzielić na dwie części o długości $\text{[math]}$ Maksymalny fragment w tym przedziale może znajdować się w całości w lewej części, w całości w prawej części lub może składać się z maksymalnego fragmentu, który dotyka prawej krawędzi lewej części, oraz maksymalnego fragmentu, który dotyka lewej krawędzi prawej części (por. też Rys. 4).

Załóżmy, że $\text{[math]}$ i zbudujmy drzewo przedziałowe (Rys. 5). Drzewo będzie miało węzły o numerach od 1 do $\text{[math]}$ W węźle $\text{[math]}$ dla $\text{[math]}$ tego drzewa będą znajdować się informacje o przedziale $\text{[math]}$ a konkretnie: $\text{[math]}$ – suma liczb w przedziale, $\text{[math]}$ – maksymalny fragment w przedziale oraz $\text{[math]}$ i $\text{[math]}$ – maksymalne fragmenty dotykające odpowiednio lewego i prawego końca przedziału. Wartości w węzłach najniższego poziomu (tzn. dla $\text{[math]}$ ) inicjujemy, przyjmując $\text{[math]}$ oraz $\text{[math]}$ Wartości w pozostałych węzłach $\text{[math]}$ wyznaczamy na podstawie wartości w węzłach $\text{[math]}$ i $\text{[math]}$ które odpowiadają lewej i prawej połowie przedziału:

$pict$

Wyznaczenie wartości we wszystkich węzłach zabiera czas $\text{[math]}$ i w takim czasie działa algorytm A5. Odpowiedzią jest, oczywiście, wartość $\text{[math]}$

Skonstruowane drzewo przedziałowe wyróżnia się tym, że umożliwia ono znalezienie największego fragmentu dla dowolnego przedziału tablicy w czasie $\text{[math]}$ W tym celu przypomnijmy, że każdy przedział można podzielić na $\text{[math]}$ przedziałów bazowych, tzn. przedziałów, które odpowiadają węzłom drzewa przedziałowego (Rys. 5). Niech $\text{[math]}$ będą kolejnymi węzłami odpowiadającymi takiemu podziałowi. Wtedy maksymalny fragment to będzie albo $\text{[math]}$ dla pewnego $\text{[math]}$ albo

display-math

dla pewnych $\text{[math]}$

Poniższa pętla wyznacza maksymalny fragment $\text{[math]}$ w czasie $\text{[math]}$ :

display-math

Algorytm A6 jest następujący: najpierw budujemy drzewo przedziałowe (jak w algorytmie A5) oraz drugie drzewo przedziałowe, które będzie liczyło minimalne fragmenty. Oprócz wartości $\text{[math]}$ będziemy potrzebować również końców fragmentów – odpowiednie wzbogacenie drzewa przedziałowego zostawiamy jako ćwiczenie dla Czytelników. Wszystkie przedziały trzymamy w kolejce priorytetowej: przedziały $\text{[math]}$ z priorytetami równymi minimalnym fragmentom w tych przedziałach, zaś przedziały $\text{[math]}$ z priorytetami równymi maksymalnym fragmentom.

Każdy krok algorytmu to wyciągnięcie z kolejki przedziału o priorytecie o największej wartości bezwzględnej, uaktualnienie wyniku o wartość bezwzględną tego priorytetu, a następnie dodanie trzech nowych przedziałów do kolejki. Cały algorytm działa w czasie $\text{[math]}$

***

Algorytm A6 jest efektywny, ale dość skomplikowany w implementacji. Przedstawimy teraz prostszy (choć nieco zaskakujący) algorytm, na który autor artykułu wpadł, próbując udowodnić poprawność algorytmów A4 i A6. Algorytm ten korzysta z metody „spróbujmy to zrobić od końca”.

Wypiszmy liczby z tablicy w ciągu i podzielmy go na maksymalne bloki liczb o tym samym znaku (na potrzeby definicji bloku traktujemy 0 jako liczbę dodatnią). Zauważmy, że w optymalnym rozwiązaniu każdy fragment musi zaczynać się i kończyć pełnym blokiem, który zawiera liczby dodatnie (jeśli kończyłby się niepełnym blokiem dodatnim, to moglibyśmy ten fragment rozszerzyć, uzyskując nie gorsze rozwiązanie, a gdyby kończył się blokiem ujemnym – moglibyśmy go skrócić). Możemy więc zastąpić każdy blok przez jedną liczbę będącą sumą elementów tego bloku. Dodatkowo dodajmy na obu końcach ciągu liczbę-strażnika $\text{[math]}$ (Rys. 6).

Jeśli w nowym ciągu mamy co najwyżej $\text{[math]}$ liczb dodatnich, to ich suma jest rozwiązaniem zadania. W przeciwnym przypadku będziemy iteracyjnie skracać ciąg, nie zmieniając optymalnego rozwiązania.

Faza skracania jest następująca: wybieramy liczbę w ciągu o najmniejszej wartości bezwzględnej, $\text{[math]}$ a następnie zastępujemy ją i dwie liczby z nią sąsiadujące – ich sumą. Zauważmy, że nowa liczba $\text{[math]}$ będzie miała przeciwny znak do $\text{[math]}$ więc krótszy ciąg nadal będzie zawierał naprzemiennie liczby dodatnie i ujemne. Fazę skracania można wykonać w czasie $\text{[math]}$ – wystarczy trzymać elementy ciągu na liście, a poza tym mieć kolejkę priorytetową z liczbami uporządkowanymi względem ich wartości bezwzględnych. Zatem algorytm A8 będzie działał w czasie $\text{[math]}$

Pozostaje udowodnić poprawność operacji skracania. Powiedzmy, że ciąg składa się z 9 liczb oraz że liczbą o najmniejszej wartości bezwzględnej jest $\text{[math]}$ (dodatnia), więc chcemy skrócić ciąg, zastępując $\text{[math]}$ przez ich sumę (Rys. 7). Chcemy wykazać, że istnieje optymalne rozwiązanie, w którym każdy fragment albo zawiera wszystkie liczby $\text{[math]}$ albo nie zawiera żadnej z nich. W tym celu pokażemy, jak z rozwiązania optymalnego niespełniającego tego warunku skonstruować rozwiązanie optymalne, które go spełnia. Rozważymy dwa przypadki:

(1) Rozwiązanie zawiera fragment, do którego należą dwie spośród liczb $\text{[math]}$ Wyrzucając z tego fragmentu obie te liczby, dostaniemy nie gorsze rozwiązanie (bo $\text{[math]}$ ).
(2) Rozwiązanie zawiera jedną liczbę (czyli fragment $\text{[math]}$ ). Fragmentów jest mniej niż liczb dodatnich. Jeśli zatem jakaś z liczb dodatnich (powiedzmy $\text{[math]}$ ) nie należy do żadnego fragmentu, to zamieniając ją z $\text{[math]}$ dostaniemy nie gorsze rozwiązanie (bo $\text{[math]}$ ). W przeciwnym przypadku co najmniej jeden fragment zawiera więcej niż jedną liczbę (powiedzmy $\text{[math]}$ ). Możemy zatem wyrzucić z niego jedną liczbę ujemną $\text{[math]}$ rozbijając go na dwa fragmenty. Wyrzucając również fragment $\text{[math]}$ znowu dostaniemy nie gorsze rozwiązanie (bo $\text{[math]}$ ).

Dowód, gdy liczba o najmniejszej wartości bezwzględnej jest ujemna, jest symetryczny i zostawiamy go jako ćwiczenie dla Czytelników.

I wreszcie nadszedł czas na obiecaną wskazówkę do dowodu poprawności algorytmów A4 i A6. Wykonujmy kolejne fazy tych algorytmów, do momentu, aż wszystkie fragmenty będą zawierać liczby o tych samych znakach. Następnie wykonajmy na tak uzyskanym ciągu algorytm A8. Porównując podział tablicy po $\text{[math]}$ -tej fazie algorytmu A4 i przed $\text{[math]}$ -tą od końca fazą algorytmu A8, możemy dojść do wniosku, że w zasadzie te algorytmy działają tak samo, tylko w odwrotnej kolejności. Szkoda, że na giełdzie nie można najpierw sprzedać, a potem kupić...