Złośliwy problem (MAX , +) i kubełkowe struktury danych

Dany jest ciąg złożony z $\text{[math]}$ nieujemnych liczb całkowitych $\text{[math]}$ Na ciągu $\text{[math]}$ chcemy wykonywać operacje dwóch rodzajów:

update $\text{[math]}$ – modyfikuje wartości wyrazów ciągu o indeksach z przedziału od $\text{[math]}$ do $\text{[math]}$ w sposób zależny od parametru $\text{[math]}$ (dodatniej liczby całkowitej);
query $\text{[math]}$ – podaje zagregowaną wartość dla podciągu o indeksach od $\text{[math]}$ do $\text{[math]}$

W obydwu przypadkach zakładamy, że $\text{[math]}$

Będziemy rozważali dwie różne operacje update, które oznaczymy symbolicznie przez $\text{[math]}$ i $\text{[math]}$ W operacji $\text{[math]}$ należy do każdego wyrazu podciągu $\text{[math]}$ dodać liczbę $\text{[math]}$ Z kolei operacja $\text{[math]}$ polega na zmianie wartości wyrazu $\text{[math]}$ na $\text{[math]}$ – innymi słowy, jeśli wyraz miał wcześniej wartość nie mniejszą niż $\text{[math]}$ to jej nie zmienia, a jeśli jego wartość była mniejsza od $\text{[math]}$ to jego nową wartością jest $\text{[math]}$

Podobnie definiujemy dwie operacje query: $\text{[math]}$ i $\text{[math]}$ Na zapytanie $\text{[math]}$ odpowiadamy, podając sumę wyrazów z podciągu $\text{[math]}$ Odpowiedzią na zapytanie typu $\text{[math]}$ jest natomiast wartość największego wyrazu w rozważanym podciągu.

Biorąc pod uwagę wszystkie kombinacje poszczególnych operacji, otrzymujemy cztery różne warianty problemu. Każdy taki wariant oznaczamy za pomocą pary, której pierwszy wyraz opisuje rodzaj operacji modyfikacji, a drugi określa zapytanie. Mamy zatem następujące warianty: $\text{[math]}$ oraz $\text{[math]}$

Okazuje się, że nasz problem ma kilka ciekawych zastosowań. Wariant $\text{[math]}$ można wykorzystać do implementacji systemu obsługi rezerwacji miejsc w pociągu na trasie łączącej $\text{[math]}$ stacji. W pociągu znajduje się ustalona liczba miejsc siedzących. Każda rezerwacja dotyczy konkretnej liczby pasażerów i wskazuje numery dwóch stacji, na których pasażerowie zamierzają wsiąść i wysiąść. Naszym celem jest przyjmować kolejno wszystkie rezerwacje, które nie powodują przepełnienia pociągu.

Oznaczmy przez $\text{[math]}$ aktualną liczbę pasażerów, którzy będą w pociągu na trasie pomiędzy stacjami $\text{[math]}$ oraz $\text{[math]}$ Rezerwację na podróż ze stacji $\text{[math]}$ do stacji $\text{[math]}$ dla $\text{[math]}$ pasażerów możemy przyjąć, jeśli wartość query $\text{[math]}$ jest nie większa niż liczba miejsc w pociągu. Po przyjęciu rezerwacji wykonujemy update $\text{[math]}$

Inaczej można na to spojrzeć jak na problem kontroli przesyłania danych między serwerami połączonymi jedną linią danych o określonej przepustowości albo problem obsługi pobierania danych z Internetu przez użytkowników sieci lokalnej w zadanych przedziałach czasowych (sieć ma ograniczony transfer).

Wariant $\text{[math]}$ ma natomiast elegancką interpretację kombinatoryczną powiązaną z popularną grą Tetris. Odpowiada on mianowicie sytuacji, w której klocki, które opadają na planszę, mają regularną strukturę (np. mają kształt prostokątów), a naszym celem jest, dla każdego klocka, orzec, w którym miejscu się on zatrzyma, jeśli spuścimy go z zadanej pozycji początkowej (nie mamy możliwości wykonywania w locie obrotów ani przesunięć). Z kolei wariant $\text{[math]}$ reprezentuje dynamiczny problem obliczania sum częściowych ciągu.

Trzy z podanych wariantów wyjściowego problemu mają zatem jasno określoną interpretację. Co więcej, znane są ich efektywne rozwiązania, w których koszt obsługi ciągu $\text{[math]}$ zapytań to $\text{[math]}$ (szukaną strukturą danych są tzw. drzewa przedziałowe, o których więcej można przeczytać lub posłuchać na stronie http://was.zaa.mimuw.edu.pl).

Za to czwarty wariant, $\text{[math]}$ jest inny. Jego interpretacja kombinatoryczna nie jest wcale aż tak jasna, a do tego nie znamy sposobu rozwiązania go w czasie $\text{[math]}$ (w tym przypadku klasyczne drzewa przedziałowe nie sprawdzają się). Okazuje się jednak, że można go w miarę prosto rozwiązać, korzystając z pewnej kubełkowej struktury danych. Nasze rozwiązanie będzie działało w czasie $\text{[math]}$

Zacznijmy od podziału wyrazów ciągu pomiędzy kubełki, umieszczając w każdym kubełku, z wyjątkiem ostatniego, $\text{[math]}$ wyrazów. Jeśli ostatni kubełek jest mniejszy, możemy uzupełnić go sztucznymi wyrazami do rozmiaru $\text{[math]}$ Oprócz kolejnych wyrazów ciągu kubełek będzie przechowywał pewne dane pomocnicze. Zanim opiszemy strukturę kubełka, zaproponujmy trochę inny sposób myślenia o operacji update $\text{[math]}$ Zamiast mówić, że dla każdego $\text{[math]}$ takiego że $\text{[math]}$ wykonujemy $\text{[math]}$ można wyobrazić sobie, że dodajemy nowe ograniczenie dolne na liczby na pozycjach od $\text{[math]}$ do $\text{[math]}$ Wtedy wartość liczby w kubełku będzie równa maksimum z jej początkowej wartości oraz wszystkich ograniczeń dolnych jej dotyczących. Takie ograniczenia dolne będą trzymane osobno dla każdego kubełka.

Struktura kubełka będzie następująca:

$\text{[math]}$ – tablica kolejnych wyrazów ciągu, które znajdują się w kubełku;
$\text{[math]}$ – posortowana tablica liczb $\text{[math]}$
$\text{[math]}$ – sumy prefiksowe tablicy $\text{[math]}$ czyli $\text{[math]}$
$\text{[math]}$ – dolne ograniczenie na wszystkie wyrazy ciągu przechowywane w kubełku, czyli maksimum z wartości $\text{[math]}$ z operacji update $\text{[math]}$ dotyczących całego przedziału kubełka; aktualna wartość $\text{[math]}$ -tej liczby z kubełka to zawsze $\text{[math]}$

Każdy kubełek umożliwia wykonywanie następujących operacji pomocniczych (szczegółowy opis ich implementacji znajduje się w dalszej części artykułu):

1.: $\text{[math]}$ – obliczenie sumy aktualnych wartości wszystkich wyrazów ciągu zawartych w kubełku (działa w czasie $\text{[math]}$ );
2.: $\text{[math]}$ – obliczenie sumy wyrazów o indeksach od $\text{[math]}$ do $\text{[math]}$ dla $\text{[math]}$ (działa w czasie $\text{[math]}$ );
3.: $\text{[math]}$ – aktualizacja dolnego ograniczenia na całym przedziale do wartości co najmniej $\text{[math]}$ (działa w czasie $\text{[math]}$ );
4.: $\text{[math]}$ – zwiększenie wyrazów o indeksach od $\text{[math]}$ do $\text{[math]}$ dla $\text{[math]}$ do wartości co najmniej $\text{[math]}$ (działa w czasie $\text{[math]}$ ).

Zauważmy teraz, że dowolny zakres indeksów od $\text{[math]}$ do $\text{[math]}$ można rozbić na pewną liczbę pełnych kubełków (oczywiście, nie więcej niż $\text{[math]}$ ) oraz na co najwyżej dwa niepełne kubełki (te skrajne). Dzięki temu zapytanie o sumę liczb na przedziale od $\text{[math]}$ do $\text{[math]}$ można podzielić na nie więcej niż $\text{[math]}$ zapytań $\text{[math]}$ oraz co najwyżej dwa zapytania $\text{[math]}$ Stąd każde takie zapytanie obsługujemy w czasie $\text{[math]}$ Operację modyfikacji ciągu na indeksach od $\text{[math]}$ do $\text{[math]}$ można także wykonać w czasie $\text{[math]}$ podobnie rozbijając cały przedział na nie więcej niż $\text{[math]}$ kubełków, na których wykonujemy operację $\text{[math]}$ i co najwyżej dwa brzegowe kubełki z wykonywaną operacją $\text{[math]}$

Przykład 1. W tabeli przedstawiono, jak zmienia się przykładowa kubełkowa struktura danych $\text{[math]}$ w wyniku pojedynczej modyfikacji. Warto zwrócić uwagę, że w środkowym kubełku zmienia się tylko dolne ograniczenie, tj. $\text{[math]}$

Pozostaje opisać, jak korzystając z przechowywanych danych, efektywnie wykonać cztery operacje pomocnicze oferowane przez kubełek.

display-math

Ostatnią pozycję $\text{[math]}$ znajdujemy, wyszukując binarnie. Zauważmy, że w tablicy $\text{[math]}$ jest dokładnie $\text{[math]}$ liczb mniejszych od $\text{[math]}$ oraz dokładnie $\text{[math]}$ liczb nie mniejszych niż $\text{[math]}$ Skoro aktualna wartość każdej liczby to $\text{[math]}$ więc suma aktualnych wartości wynosi $\text{[math]}$ (sumujemy $\text{[math]}$ najmniejszych liczb) plus suma $\text{[math]}$ największych liczb, czyli $\text{[math]}$

display-math

W powyższej funkcji sumujemy aktualne wartości wyrazów z kubełka z określonych pozycji.

Aktualizacja dolnego ograniczenia na cały kubełek jest bardzo łatwa:

display-math

Jeśli pojawia się nowe dolne ograniczenie, które nie dotyczy całego zakresu obejmowanego przez kubełek, lecz jedynie jego części, należy zaktualizować liczby tylko z tego zakresu. Niestety, po takiej operacji tablice $\text{[math]}$ oraz $\text{[math]}$ stają się nieaktualne, więc obliczamy je ponownie. Oto zapis stosownego algorytmu:

display-math

Zaprezentowane rozwiązanie jest dosyć szybkie, jednak nie widać powodu, dla którego problemu $\text{[math]}$ nie można by rozwiązać jeszcze szybciej. Być może któremuś z Czytelników uda się skonstruować takie rozwiązanie?

Czytelnik, który do końca lipca 2013 roku przyśle do redakcji rozwiązanie opisanego problemu o najlepszej złożoności, nie gorszej jednak niż $\text{[math]}$ zostanie nagrodzony kilogramem szwajcarskiej czekolady w przesyłce prosto z Zurychu. W przypadku wielu rozwiązań o tej samej złożoności nagrodzimy subiektywnie najładniejsze, w przypadku tego samego najładniejszego rozwiązania – pierwsze spośród otrzymanych.