Zrób to sam
Interfejs mózg-komputer (1) - Podstawowe wiadomości
Wyobraź sobie, że jesteś uwięziony w swoim ciele. Wszystkie Twoje mięśnie są sparaliżowane. Nie możesz wydać z siebie żadnego dźwięku. Nie możesz poruszyć żadną ze swoich kończyn. Jesteś w stanie najbliższym bycia zakopanym żywcem przy zachowaniu przytomności i pełnej świadomości swojego stanu. Taki stan nazywany jest stanem zamknięcia (ang. locked-in syndrome). Jeżeli Twoje mięśnie gałek ocznych też są sparaliżowane, jest to stan zamknięcia zupełnego.
Jeżeli masz szczęście, mięśnie Twoich gałek ocznych nie są x sparaliżowane i możesz próbować komunikować się za pomocą mrugnięć. Wtedy można pokusić się o zbudowanie maszyny pozwalającej na rozszyfrowywanie i przekazywanie światu Twoich komunikatów w oparciu o ruchy gałek ocznych (ang. eye-tracking). Maszynę taką nazywać będziemy interfejsem mózg-komputer (BCI, ang. Brain-Computer Interface). Za pomocą podobnego interfejsu porozumiewa się i prowadzi prace badawcze Stephen Hawking. Z tego typu pomocy, jednak bez pośrednictwa maszyny, tylko przeszkolonej w tym kierunku osoby, korzystał przy pisaniu książki „Skafander i motyl” Jean-Dominique Bauby.
Człowiek znajdujący się w stanie zamknięcia zupełnego nie może bezpośrednio przekazywać komunikatów. Interfejs do komunikacji musi wówczas wykorzystywać sygnały generowane przez jego ciało, konkretnie przez mózg. Pewnie nikt z nas nie chciałby mieć elektrod wszczepionych inwazyjnie w korę mózgową, więc maszyna będzie musiała opierać się na EEG, czyli elektroencefalogramie – wyniku pomiaru czynności elektrycznej mózgu rejestrowanej na powierzchni skóry głowy.
Mózg jest niezwykle skomplikowanym tworem, zbudowanym z dwóch klas komórek – glejowych i neuronów. Komórki glejowe to swego rodzaju „system wspomagania” – m.in. współtworzą barierę krew-mózg, biorą udział w syntezie niektórych neuroprzekaźników, budują osłonki mielinowe aksonów, uczestniczą w odżywianiu neuronów, pełnią funkcje obronne... A neurony odpowiedzialne są za większość wytworów naszego umysłu. Neurony składają się z dendrytów, do których przekazywana jest informacja, ciała komórki i aksonów, którymi przekazują informację do innych neuronów.
Przekaźnictwo informacji w neuronach odbywa się za pomocą sygnałów elektrycznych, tzw. potencjałów czynnościowych. Przekaz informacji między neuronami jest w przeważającej części chemiczny. Aksony komórek nerwowych łączą się z dendrytami, tworząc synapsy. Gdy potencjał czynnościowy dotrze do wypustek aksonów (strona presynaptyczna synapsy), uwalniany jest związek chemiczny zwany neuroprzekaźnikiem, który następnie wyłapywany jest przez receptory chemiczne w błonie dendrytów (strona postsynaptyczna). W wyniku reakcji zachodzących w błonie i jej okolicach otwierają się kanały jonowe błony postsynaptycznej i do dendrytów wpływają jony, tworząc prąd postsynaptyczny.
Komórki nerwowe można traktować jak małe źródła prądowe – po transferze synaptycznym do neuronu postsynaptycznego wpływa prąd. EEG odzwierciedla taką skorelowaną aktywność synaptyczną – sumujące się prądy postsynaptyczne, czyli aktywność elektryczną dendrytów.
Amplituda sygnału EEG zmienia się w zakresie od 0 do ogólnie jednak rzadko przekracza wartość EEG jest sygnałem o charakterze szumu kolorowego – jego widmo amplitudowe nie jest płaskie i zależy od częstości jak
W ciągu dziesięcioleci badań i zastosowań w medycynie sklasyfikowano szereg charakterystycznych rytmów i tzw. grafoelementów, czyli krótkich fragmentów sygnału wykazujących określone cechy i pojawiających się w określonych stanach mózgu. Te dotyczące EEG podczas czuwania są pokrótce opisane poniżej.
- Fale alfa są rytmiczną aktywnością w paśmie . Występowanie rytmu alfa przypisuje się stanowi relaksu z zamkniętymi oczami. Fale alfa najlepiej widoczne są w odprowadzeniach tylnych, czyli z okolic części kory odpowiadającej za przetwarzanie informacji wzrokowych. Rytm o częstości rejestrowany w okolicach kory motorycznej nazywany jest też rytmem W momencie wykonywania ruchu przez człowieka lub tylko zamierzenia jego wykonania można zaobserwować jego istotny zanik.
- Fale delta – aktywność o niskiej częstości i wysokiej amplitudzie. Pojawiają się w trakcie snu głębokiego, głębokiej medytacji, u małych dzieci i w przypadku pewnego rodzaju uszkodzeń mózgu.
- Fale theta – o częstości i amplitudzie rzędu kilkudziesięciu Pojawiają się w trakcie snu płytkiego, medytacji, hipnozy, intensywnego marzenia, intensywnych emocji. Odmienny rodzaj fal theta jest związany z aktywnością poznawczą, kojarzeniem – w szczególności uwagą, a także procesami pamięciowymi.
- Fale beta – o częstości w przedziale i niskiej amplitudzie. Charakteryzują zwykłą codzienną aktywność kory mózgowej u człowieka, percepcję zmysłową i pracę umysłową.
- Fale gamma – to fale mózgowe o częstości od do . Fale gamma towarzyszą aktywności ruchowej i funkcjom motorycznym. Fale gamma związane są też z wyższymi procesami poznawczymi, m.in. percepcją sensoryczną, pamięcią. Przypuszcza się, że rytm gamma o częstotliwości około ma związek ze świadomością percepcyjną (dotyczącą wrażeń zmysłowych i ich postrzegania) oraz związany jest z integracją poszczególnych modalności zmysłowych w jeden spostrzegany obiekt.
- Iglice – wyładowania padaczkowe, obserwowane także w czynności międzynapadowej. Wyróżniają się z podstawowego sygnału, mają ostry wierzchołek i amplitudę dużo wyższą od amplitudy tła.
Należy zawsze pamiętać o tym, że EEG jest sygnałem wykazującym ogromną zmienność międzyosobniczą i międzyzapisową, co powoduje, że jego analiza i klasyfikacja cech nie jest wcale prosta.
Kolejnym grafoelementem występującym w zapisie czynności elektrycznej
mózgu są tzw. potencjały wywołane ( evoked potentials). Zwykle mają one
bardzo niską amplitudę rzędu
i bardzo trudno jest je wyróżnić na
tle całego sygnału. Sposobem na ich wyodrębnienie z zapisu jest wielokrotne
powtarzanie odczytu w takich samych warunkach i uśrednienie sygnału.
Schemat ten przedstawiony jest na rysunkach 2 i 3.
W rzeczywistości potencjały wywołane są odpowiedzią na kilkanaście do kilkudziesięciu tysięcy bodźców. Gromadzona od dziesięcioleci wiedza o behawioralnych i klinicznych korelatach potencjałów wywołanych opiera się na rozpoznawaniu tzw. załamków w przebiegach uśrednionych, czyli przejściowych wzrostów lub spadków potencjału (np. na rysunku 3 widać załamek P300). Nazwy załamków składają się zwykle z litery „P” (od ang. positive), jeśli wychylenie jest dodatnie, lub „N” (od ang. negative), jeśli wychylenie jest ujemne, oraz liczby. Liczba określa przybliżoną liczbę milisekund od wystąpienia bodźca, czyli tak zwaną latencję.
Jak mierzyć potencjał elektryczny na głowie? Wiemy już, że EEG osiąga wartości dlatego też do jego rejestracji musimy użyć mikrowoltomierza. Potrzebujemy też sond do połączenia mikrowoltomierza z powierzchnią skóry i komputera, żeby analizować zebrany sygnał. Ze względu na szereg trudności pomiarowych oprócz samego woltomierza potrzebować będziemy kilku filtrów. Przetwornik analogowo-cyfrowy posłuży nam do zdigitalizowania sygnału, co umożliwi nam analizę bardziej zaawansowaną niż wzrokowa. Całe to oprzyrządowanie nazywać będziemy encefalografem.
Układ pomiarowy składać się będzie zatem z elektrod, elektroencefalografu i komputera; pokazany jest on na rysunku 4. W praktyce, zarówno klinicznej, jak i badawczej, stosuje się tzw. elektrody mokre – wymagające użycia substancji poprawiających przewodzenie prądu pomiędzy skórą a elektrodą. Stanowi to dużą niewygodę i utrudnia znacznie konstrukcję domowych interfejsów mózg-komputer. Aplikacja elektrod musi być dokonana przez przeszkoloną osobę, ponadto substancje, o których mowa, mają krótkotrwałe – rzędu kilkunastu, kilkudziesięciu godzin – działanie, dlatego też elektrody wymagają stosunkowo częstej reaplikacji.
Pierwszą składową elektroencefalografu są oczywiście wzmacniacze. Sygnał generowany przez mózg ma bardzo małą amplitudę i przed dalszą analizą musi zostać wzmocniony.
Zebrany sygnał jest cyfrowy, czyli dyskretny – próbkowany z pewną częstością oznaczaną zwyczajowo jako W czasie próbkowania sygnału z częstością składowe sygnału o częstościach wyższych od będą nakładać się na składowe o częstościach niższych od zniekształcając sygnał. W celu uniknięcia tego zjawiska, zwanego aliasingiem, sygnał przed zdigitalizowaniem należy przefiltrować analogowym filtrem dolnoprzepustowym, czyli pozostawiającym jedynie częstości niższe niż co uwzględnione jest w schemacie układu doświadczalnego na rysunku 4.
Czynność elektryczna mózgu obserwowana na powierzchni głowy jest sygnałem o niewielkiej amplitudzie. Większość sygnałów elektrycznych w naszym otoczeniu i organizmie ma amplitudę o rzędy wielkości większą, co zakłóca pomiar.
Pierwszym problemem jest, oczywiście, otaczające nas promieniowanie elektromagnetyczne o częstości , które emitowane jest przez wszystkie urządzenia elektryczne wokół nas. Często, by się od niego odizolować, pomiary przeprowadza się w klatkach Faradaya, aczkolwiek wiele urządzeń ma wbudowany filtr pasmowo-zaporowy eliminujący tę częstość z mierzonego sygnału.
Kolejnym problemem jest akcja serca pacjenta. EKG ma najwyższą amplitudę ze wszystkich sygnałów elektrycznych wytwarzanych przez nasze narządy (tak, nawet nasze jelita generują czynność elektryczną, a popularny wariograf w dużej mierze opiera się na pomiarze czynności elektrycznej skóry) i każda elektroda na powierzchni naszej skóry mierzy przede wszystkim EKG. Serca nie możemy wyłączyć. Jednakże, żeby nie skupiać się na jego akcji, stosuje się tzw. referencję – wybiera się odpowiedni sygnał bazowy, odzwierciedlający wszystkie inne sygnały elektryczne wytwarzane przez nasze ciało, i odejmuje się go od sygnałów mierzonych na głowie. Taką referencją może być elektroda przypięta na uchu czy brodzie, a może być też uśredniony sygnał ze wszystkich elektrod pomiarowych, który odejmowany jest w każdej chwili pomiaru.
Pomiędzy skórą, elektrolitem a elektrodą zachodzą różne zjawiska fizyczne i chemiczne. Przy pewnych połączeniach do wzmacniacza mogą spowodować one powstanie zakłócenia w postaci fali o bardzo niskiej częstości i dużej amplitudzie występującej w sygnałach z jednej lub wielu elektrod. Z tego powodu w elektroencefalografie znajduje się też filtr górnoprzepustowy.
Zwykle sygnał, którym dysponujemy, mierzony jest na powierzchni skóry za pomocą dużych (o średnicy ok. 0,5 cm) elektrod. Idealnie byłoby mierzyć sygnał z pojedynczych populacji neuronów, który, wydaje się, lepiej odzwierciedlałby zmiany zachodzące w mózgu, ale nikt chyba nie chciałby chodzić z dziurą w czaszce i cienkimi igłami – elektrodami wbitymi w odpowiednie ośrodki kory mózgowej.
Zatem to, co jesteśmy w stanie zmierzyć na powierzchni skóry głowy, to jedynie (w uproszczeniu) potencjały zsumowane w wyniku synchronicznej aktywności dużych grup neuronów i przefiltrowane przez czaszkę i skórę. A dokładniej, różnice pomiędzy tymi potencjałami. Wydaje się, że taki pomiar nie do końca pozwala nam poznać zachowanie populacji neuronów, lecz tylko pewne bardziej „wysokopoziomowe” procesy.
Można się zatem domyślić, że badając EEG, nie odczytujemy bezpośrednio myśli. Jak w takim przypadku możemy zbudować interfejs mózg-komputer? Brzmi to jak jakieś oszustwo. Okazuje się, że jest pewna ilość charakterystycznych zjawisk, zachowań dużych grup neuronów, które obserwujemy w EEG, odpowiadających różnym rodzajom aktywności mózgu. Możemy wykorzystać je do świadomego generowania sygnału sterującego. Oto niektóre z nich.
Potencjały wywołane (oznaczane też niekiedy z ang. ERP – event-related potentials), o których już wspomniałyśmy. Nasz mózg reaguje na różnorakie bodźce pojawiające się w naszym otoczeniu, a niektóre typy tych reakcji możemy zaobserwować w EEG w postaci potencjałów wywołanych, czyli charakterystycznych „załamków” pojawiających się w sygnale. Najbardziej charakterystyczny i najprostszy do zaobserwowania jest tzw. potencjał P300 (na rysunku 3), który pojawia się najczęściej około 300 ms od momentu wystąpienia bodźca (w praktyce waha się to w granicach 200–700 ms w zależności od pacjenta). Załamek ten występuje, na przykład, gdy wystąpi bodziec (wzrokowy, dźwiękowy), którego się spodziewamy, czy też związany z „rejonem”, na którym skupiamy uwagę. Obserwujemy go w sygnale zebranym głównie znad trzech obszarów kory mózgowej: odpowiadających za uwagę i pamięć, przetwarzanie zadań i podejmowanie decyzji.
Jak na tym oprzeć budowę interfejsu mózg-komputer? Przykładowo można stworzyć aplikację do pisania w następujący sposób: prezentujemy pacjentowi ekran z literami alfabetu, które są w losowy sposób podświetlane. Pacjent skupia wzrok i uwagę na literze, którą chce napisać, a w momencie jej podświetlenia w sygnale EEG zanotujemy załamek P300.
Steady-state visually evoked potentials. Gdy obserwujemy bodziec wizualny pojawiający się z określoną częstością, neurony w rejonach kory wzrokowej zaczynają pracować z tą samą częstością. W widmie EEG zaobserwujemy zatem silniejsze występowanie składowej o częstości, z jaką występuje bodziec, co pokazane jest na rysunku 5.
Wyobrażenia ruchu. W różnych fazach „postępu” ruchu obserwujemy różne zjawiska w EEG. Tuż przed wykonaniem ruchu następuje chwilowy wzrost energii sygnału w pasmie gamma, zaczyna spadać energia w pasmie alfa i beta. Spadek ten utrzymuje się chwilę po wykonaniu ruchu i wtedy następuje też wzrost energii w pasmie beta, zwany odrzutem beta. Co ciekawe, nie musi to być faktyczne wykonanie, wystarczy jedynie wyobrażenie ruchu. Jest to bardzo istotne, bowiem daje szansę na obserwowanie wyobrażeń ruchu np. ręką u pacjenta, który tej ręki nie ma, bądź też w wyniku choroby neurodegeneracyjnej utracił kontrolę nad mięśniami. Tacy pacjenci też mogą korzystać z interfejsów mózg-komputer opartych o wyobrażenia ruchu.
W tym artykule pokrótce przedstawiłyśmy podstawowe wiadomości dotyczące tworzenia interfejsów mózg-komputer opartych o nasze „fale mózgowe”, czyli EEG. W kolejnej części postaramy się przybliżyć bardziej praktycznie możliwości wykonania takiego urządzenia samodzielnie w domu, czy też w szkolnej pracowni.
Do następnego odcinka!