Burzliwe początki cyfrowego tysiąclecia

Rozpoczynając na początku lat 80. XX wieku studia doktoranckie na Uniwersytecie w Erlangen, Karlheinz Brandenburg raczej nie przypuszczał, że wyniki jego pracy przyczynią się do zrewolucjonizowania branży muzycznej na całym świecie. A zaczęło się od tego, że jego promotor, profesor Dieter Seitzer, rozważał zagadnienie przesyłania muzyki liniami telefonicznymi...

Ze względu na znaczne pogorszenie jakości dźwięku analogowy przesył nie wchodził w grę, należało więc użyć technologii ISDN (Integrated Services for Digital Network) umożliwiającej jednoczesne przesyłanie tymi liniami sygnału cyfrowego (co w niedalekiej przyszłości wykorzystano do dostarczenia Internetu do masowego odbiorcy). Problemem była zbyt mała przepustowość tego kanału wynosząca 128 kb/s (kilobitów na sekundę). Świeżo wypromowany standard płyty kompaktowej opisywał kodowanie dźwięku, w którym na jedną minutę potrzebne jest około 10 MB (pisaliśmy o tym w Delcie 10/2011), zatem wymagana przepustowość wynosiła 1411,2 kb/s, czyli nieco ponad 11 razy więcej niż umożliwiała ISDN. Próbując opatentować swój pomysł, Seitzer został odesłany z kwitkiem z biura patentowego, gdyż "nie patentuje się rzeczy niemożliwych".

Brandenburg, próbując zrealizować wizję Seitzera, postanowił zmniejszyć ilość danych potrzebnych do zapisu dźwięku, czyli dokonać jego kompresji. Niestety, metody kompresji bezstratnej (które redukują liczbę bitów potrzebną do przesłania redundantnych informacji, ale w taki sposób, że nadal jest możliwe wierne odtworzenie pierwotnych danych) nie za dużo mogą pomóc w przypadku cyfrowej muzyki (średnio można przyjąć, że pozwalają zmniejszyć rozmiar danych o połowę). Potrzebna była kompresja stratna, polegająca na usunięciu części informacji, ale w taki sposób, by zostało to niezauważone przez odbiorcę.

Aby podjąć decyzję, które dane mogą być usunięte, Brandenburg skorzystał z modelu psychoakustycznego, który opisuje, jak działają uszy i mózg w odbieraniu dźwięku. Przykładowo, choć człowiek słyszy dźwięki w zakresie od 12 Hzdo 20 kHz, to maksymalna czułość występuje w zakresie od 2 kHzdo 4 kHz. Zatem można rozdzielić sygnał dźwiękowy na kilka pasm obejmujących różne zakresy częstotliwości i zakodować z mniejszą dokładnością pasma odbierane przez ludzkie ucho z mniejszą czułością. Model opisuje też zjawisko maskowania, które polega na tym, że głośny dźwięk potrafi zagłuszyć cichsze dźwięki o podobnej częstotliwości, a także cichsze dźwięki, które występują zaraz po nim lub tuż przed nim. Dzięki temu te cichsze dźwięki również można zapisać, używając mniejszej liczby bitów.

W 1988 roku powołano międzynarodową grupę standaryzacyjną MPEG (Moving Picture Experts Group) zrzeszającą inżynierów z różnych ośrodków naukowych, których celem było wypracowanie algorytmów kompresji obrazu i dźwięku. W ramach jednego z jej zespołów kontynuował swe badania Brandenburg. W wywiadach przywołuje on różne anegdoty z tego okresu, jak choćby to, że dobierając parametry algorytmu kompresji, przesłuchał niemal tysiąc razy piosenkę Suzanne Vegi Tom's Dinner, lub to, że kolejne nieudane próby zaimplementowania teoretycznie poprawnego algorytmu spowodowane były błędem w używanym przez niego kompilatorze. Ostatecznie prace zespołu zaowocowały przyjętym trzy lata później standardem kompresji dźwięku nazwanym oficjalnie MPEG $− 1$ Audio Layer III, który urzeczywistnił marzenie Seitzera, gdyż umożliwiał kompresję dźwięku z przepustowością 128 kb/s bez znacznego pogorszenia jego jakości.

Początkowo opracowany standard nie przyjął się w przemyśle jako zbyt skomplikowany i wymagający zbyt dużej mocy obliczeniowej, jak na możliwości ówczesnego sprzętu (do użytku wszedł prostszy standard MPEG $|−1$ Audio Layer II, aktualnie nadal stosowany do przesyłu audycji radia cyfrowego). Ale gdy w 1997 roku firma Intel wypuściła na rynek procesor Pentium MMX, komputery osobiste stały się wystarczająco silne, by podołać zadaniu kompresji. Jedną z decyzji, które musieli podjąć koledzy Brandenburga, było przyjęcie trzyliterowego rozszerzenia plików, w których zapisywane byłyby dane zakodowane ich algorytmem. Tak narodził się, dziś znany chyba wszystkim użytkownikom komputerów, skrót MP3.

Również w 1997 roku zadebiutował program Winamp, który umożliwiał odtwarzanie plików zapisanych w tym standardzie, a same pliki można było znajdować w Internecie za pośrednictwem strony mp3.com. Początkowo naukowcy chcieli zarobić na swoim wynalazku, sprzedając kosztowną licencję na oprogramowanie kompresujące dźwięk, a jednocześnie ułatwić powstawanie oprogramowania dekodującego. Szybko się jednak okazało, że taki model biznesowy się zupełnie nie sprawdzi, gdyż w Internecie pojawiło się darmowe oprogramowanie kompresujące. Spowodowało to lawinowy wzrost liczby plików MP3. W 1999 roku powstał serwis Napster, który umożliwiał wyszukiwanie i wymienianie się plikami MP3 bezpośrednio między komputerami użytkowników (peer-to-peer file sharing). Popyt na "darmową" muzykę z komputera był tak duży, że w pewnym momencie fraza "mp3" była najczęściej wyszukiwanym hasłem w Internecie.

Na odpowiedź branży muzycznej nie trzeba było długo czekać. Na właścicieli Napstera i podobnych witryn internetowych, które pojawiały się jak grzyby po deszczu, posypały się pozwy o naruszanie praw autorskich, a konkretnie dopiero co przegłosowanej amerykańskiej ustawy DMCA (Digital Millennium Copyright Act). W zasadzie do dziś działalność organizacji takich jak RIAA (Recording Industry Association of America) na polu muzyki w Internecie zdaje się ograniczać do pozywania autorów i indywidualnych użytkowników programów do wymiany plików oraz publikowania mało wiarygodnych raportów dokumentujących rzekome straty branży muzycznej spowodowane tą wymianą.

Pierwszy sklep internetowy, w którym można było legalnie zakupić pliki z cyfrową muzyką, został otworzony przez firmę Apple dopiero w 2003 roku, a to też tylko dzięki determinacji Steve'a Jobsa. Niestety, sprzedawane tam pliki były zabezpieczone mechanizmami DRM (Digital Rights Management), które w teorii miały przeciwdziałać odtwarzaniu plików na nieuprawnionych urządzeniach (a zatem ukrócić udostępnianie ich w Internecie), a w praktyce sprawiają jedynie kłopot legalnym nabywcom.

Mechanizmy DRM są krytykowane za to, że pod pretekstem ochrony praw autorskich ograniczają one uprawnienia nabywcy (np. te powszechnie stosowane w filmach na płytach DVD i Blu-ray uniemożliwiają wykonanie kopii zapasowej, odtworzenie filmu na sprzęcie pochodzącym z innego regionu geograficznego czy pominięcie reklam). Czasem mogą też działać na szkodę nabywcy, jak to miało miejsce w głośnej sprawie płyt kompaktowych produkowanych przez firmę Sony, które instalowały na komputerach użytkowników niebezpieczne oprogramowanie. A w świetle ustawy DMCA tworzenie i rozpowszechnianie programów, służących obchodzeniu tych mechanizmów (nieważne jak uciążliwe lub szkodliwe by one były) także jest niezgodne z prawem.

Dopóki więc muzyka lub film "ściągnięte za darmo" z Internetu będą mniej problematyczne w obsłudze od legalnie zakupionych egzemplarzy, nie ma co liczyć na zmianę przyzwyczajeń internautów, którzy nieskrępowany dostęp do cyfrowych treści, zapoczątkowany przez upowszechnienie się formatu MP3, uważają dziś za coś naturalnego.