Przeskocz do treści

Delta mi!

Co to jest?

Liczby zespolone i kwaterniony

Zbigniew Marciniak

o artykule ...

  • Publikacja w Delcie: październik 2016
  • Publikacja elektroniczna: 2 października 2016
  • Wersja do druku [application/pdf]: (212 KB)

Tak jak problemy praktyczne prowadzą do równań, tak równania prowadzą czasem do nowych rodzajów liczb. Ambitny kmieć z czasów Mieszka I, będący właścicielem trzech krów i marzący o nabyciu (lub zdobyciu) dodatkowych sztuk bydła tak, by stać się szanowanym posiadaczem tuzina krów, musiał niewątpliwie rozwiązywać zadanie matematyczne, które dziś zapisujemy równaniem 3 + x = 12: Gdy zamienimy występujące tu liczby miejscami, otrzymamy równanie x + 12 = 3; które "nie da się rozwiązać": gołym okiem widać, że wśród liczb, za pomocą których zwykliśmy liczyć krowy (czyli liczb naturalnych), nie znajdzie się żadna, która by spełniała to równanie...

obrazek

Równanie to ma jednak sens praktyczny: opisuje stan posiadania pewnego mieszkańca sąsiedniej wioski przed i po spełnieniu marzeń naszego kmiecia. Żeby to równanie rozwiązać, potrzebne są nowe liczby - tu są to liczby ujemne. W tak powiększonym zbiorze liczb, zwanym zbiorem liczb całkowitych, każde równanie postaci |x + a = b, gdzie a i |b to liczby całkowite, ma rozwiązanie.

Żeby rozwiązać równanie  2 x − 2 = 0, nie wystarczą nie tylko liczby całkowite, ani nawet wszystkie liczby wymierne, czyli ułamki a/b zbudowane z liczb całkowitych. Aby uzyskać rozwiązanie, do liczb wymiernych trzeba dołączyć nowe liczby, a wśród nich liczbę niewymierną  -- √ 2.

Dlaczego nie wystarczy dołączyć samej liczby  √-- | 2? Bo pojedyncze liczby są tak mało użyteczne, że nawet nie zasługują na uwagę. W istocie, na pytanie co to jest liczba? istnieje tylko jedna, matematycznie użyteczna, choć pozornie paradoksalna, odpowiedź: liczba to element zbioru, którego elementy można dodawać, odejmować, mnożyć i dzielić. Zakłada się przy tym, że działania te powinny spełniać pewne naturalne warunki, jak np. przemienność i łączność dodawania oraz mnożenia, istnienie odwrotności każdej liczby różnej od zera itp., dobrze znane z algebry szkolnej. Zbiory liczb, spełniające te warunki, algebraicy nazywają ciałami.

Do zapisywania wyników pomiarów najlepiej nadaje się ciało liczb rzeczywistych R, które można sobie wyobrażać jako zbiór wszystkich ułamków dziesiętnych, z (przeważnie) nieskończoną liczbą cyfr po przecinku. Prawdziwą naturę tych liczb dobrze oddaje definicja, pochodząca z jednego z najlepszych podręczników algebry: "Liczby rzeczywiste, cokolwiek by to nie było, mają następujące własności…" - tu następuje lista własności działań. Użyteczność liczb polega nie na tym, że każda z nich z osobna istnieje, lecz na tym, że możemy na nich działać.

Zbiór liczb rzeczywistych jest dostatecznie duży, by można było w nim znaleźć rozwiązania bardzo wielu użytecznych równań, ale jednak nie wszystkich; na przykład równanie  2 x + 1 = 0 nie ma rozwiązań w zbiorze |R, gdyż lewa strona tego równania jest dodatnia dla każdej liczby rzeczywistej x. Ogólniej, z lekcji algebry pamiętamy, że równanie kwadratowe ax2 + bx +c = 0 nie ma rozwiązań rzeczywistych, gdy  2 |∆ = b − 4ac < 0.

Zatem, gdy upieramy się przy tym, by równanie |x2 + 1 = 0 jednak miało rozwiązanie, musimy powiększyć zbiór R do większego ciała, które w szczególności będzie zawierać pierwiastek naszego równania - tradycyjnie oznaczymy go symbolem |i. Jest to pierwsza litera słowa imaginary, czyli urojona, no bo przecież nie jest to liczba rzeczywista…Nasze nowe ciało powinno zatem zawierać i, wszystkie "stare" liczby a, b∈ R oraz wyniki działań na nich, a więc elementy postaci a,bi, a także a +bi. Zbiór wszystkich wyrażeń tej postaci oznaczamy symbolem |C (complex numbers) i nazywamy liczbami zespolonymi.

Liczby zespolone możemy w oczywisty sposób dodawać i odejmować:

(a +bi) ± (c+ di) = (a ± c)+ (b ±d)i.

Możemy je także mnożyć - w tym celu po prostu "otwieramy nawiasy":

(a+ bi) ⋅(c+ di) = ac + adi +bci + bdi2,

a następnie korzystamy z podstawowej własności |i: jest to pierwiastek równania |x2 + 1 = 0, zatem i2 =− 1. Podstawiając tę wartość do powyższej równości, otrzymujemy wzór

(a + bi)⋅(c+ di) = (ac− bd) + (ad + bc)i∈ C.

Zauważmy, że tak zdefiniowane działania rozszerzają znane nam działania dodawania, odejmowania i mnożenia liczb rzeczywistych, co łatwo sprawdzić podstawiając w powyższych wzorach b = d = 0. Trzy działania już mamy! A co z dzieleniem? Ponieważ dzielenie to mnożenie przez odwrotność dzielnika, wystarczy znaleźć odwrotność każdego elementu |c+ di ≠0 + 0i = 0 ∈C. W tym celu zauważmy, że |(c+ di)⋅(c − di) = c2− d2i2 = c2 + d2 ∈R, skąd

(c + di)⋅( --c---− ---d---⋅i) = 1 oraz--1-- = --c---− ---d---⋅i. c2 + d2 c2 +d2 c + di c2 + d2 c2 + d2

Zatem dzielenie liczb zespolonych jest także wykonalne. Tak stworzyliśmy ciało C, które zawiera wszystkie liczby rzeczywiste oraz urojoną liczbę |i, spełniającą równanie x2 +1 = 0.

Sceptyczny Czytelnik może w tym miejscu wyrazić wątpliwość, czy warto było wykonywać tę całą pracę tylko po to, by uzyskać pierwiastek jednego konkretnego równania. W istocie nie jest aż tak źle; rozważmy dla przykładu równanie x2 + x + 1 = 0. Mamy ∆ = 12− 4⋅1⋅1 =− 3, więc w szkole w tym miejscu przestalibyśmy zajmować się tym równaniem. Gdy jednak dopełnimy lewą stronę do pełnego kwadratu:

 1 1 2 3 x2 + x +1 = x2 + 2⋅x ⋅-+ (-) + -, 2 2 4

otrzymamy równanie

 2 √ -- 2 √ -- √ -- 1- 3- 2 --3 1- --3 1- --3 (x + 2) = − 4 = i ⋅( ± 2 ) , x + 2 =± 2 ⋅i, x = − 2± 2 ⋅i.

W ten sposób znaleźliśmy dwie liczby zespolone, które są pierwiastkami naszego równania. Podobnie będzie z każdym innym równaniem kwadratowym - w ciele C zawsze bez trudu znajdziemy jego pierwiastki.

obrazek

wikipedia

Carl Friedrich Gauss (1777-1855)

wikipedia

Carl Friedrich Gauss (1777-1855)

W istocie, jak udowodnił 22-letni Carl Friedrich Gauss w roku 1799, nie tylko każdy trójmian, ale także każdy wielomian dodatniego stopnia ma w ciele |C pierwiastek; jest to tak zwane Zasadnicze Twierdzenie Algebry. Jest to prawda także wtedy, gdy współczynniki naszego wielomianu są liczbami zespolonymi.

obrazek

Ponieważ liczba zespolona a + bi ∈C jest wyznaczona przez parę liczb rzeczywistych (a,b), można ją interpretować jako punkt płaszczyzny kartezjańskiej |R2 o współrzędnych x = a,y = b. Wówczas podciało |R liczb rzeczywistych |a+ 0i wypełnia oś Ox układu współrzędnych, zaś liczba urojona |i leży na osi Oy, na wysokości 1.

Dodawanie liczby zespolonej c | + di do dowolnego punktu płaszczyzny kartezjańskiej odpowiada w tej interpretacji przesunięciu go o wektor |[c,d]. A jakim przekształceniem jest mnożenie przez liczbę i? Dla dowolnego punktu (a,b) ∈ R2 otrzymujemy

 2 (a+ bi) ⋅i = ai + bi = −b + ai.

Zatem mnożenie przez |i przenosi punkt (a,b) na punkt |(−b,a). Łatwo dostrzec, że jest to obrót płaszczyzny wokół punktu O o kąt prosty, w kierunku przeciwnym do kierunku ruchu wskazówek zegara.

Ogólniej, jeśli punkt (c, | d) leży na okręgu jednostkowym o środku w punkcie O, to liczba zespolona z | = c +di spełnia warunek

c2 + d2 = 1, skąd z = cosθ + isin θ,

dla pewnego kąta θ .

Wówczas mnożenie przez z jest obrotem płaszczyzny wokół punktu |O o kąt , θ w kierunku przeciwnym do kierunku ruchu wskazówek zegara.

Na przykład, dla liczby  3 z =− 12 +-2-⋅i, która pojawiła się wcześniej jako pierwiastek równania |x2 + x + 1 = 0, mamy z = cos 120 ○+ isin 120○, więc otrzymujemy obrót o 120○. Trzykrotne wykonanie tego obrotu doprowadzi nas zatem do punktu wyjścia; nie powinno to być zaskoczeniem, skoro przekształcenie to odpowiada mnożeniu przez |z3, zaś |z3− 1 = (z− 1)(z2 + z+ 1) = (z −1) ⋅0 = 0, skąd z3 = 1.

Widzimy zatem, że liczby zespolone pozwalają wygodnie reprezentować wszystkie ruchy sztywne płaszczyzny, czyli przekształcenia zachowujące odległości między punktami oraz orientację płaszczyzny; z kursu geometrii wiemy, że są one złożeniami przesunięć i obrotów wokół punktu |O. Analityczny opis takich przekształceń w klasycznej geometrii używa aż szóstki liczb; użycie liczb zespolonych pozwala na znacznie prostszy opis.

"Prawdziwa" geometria, tj. geometria, której używają mechanicy oraz astronomowie, rozgrywa się w przestrzeni trójwymiarowej R3. | Wiadomo, że każdy ruch sztywny tej przestrzeni jest złożeniem pewnego przesunięcia oraz obrotu wokół jednej z osi przechodzących przez punkt O | ; analityczny opis takiego przekształcenia potrzebuje aż 12 liczb. W tej sytuacji musiało pojawić się bardzo naturalne pytanie: czy trójwymiarową przestrzeń kartezjańską  3 R można wyposażyć w strukturę ciała tak, by dodawanie oraz mnożenie przez jego elementy prosto opisywało wszystkie ruchy sztywne tej przestrzeni?

obrazek

William R. Hamilton (1805-1865)

William R. Hamilton (1805-1865)

Irlandzki matematyk, fizyk i astronom William Rowan Hamilton strawił 10 lat na poszukiwaniu odpowiedniej struktury ciała na zbiorze trójek liczb rzeczywistych, analogicznej do struktury ciała liczb zespolonych na zbiorze par.

Z dodawaniem nie ma problemu: podobnie jak w przypadku dwuwymiarowym trójki liczb dodajemy po współrzędnych: (a,b,c) + (d, e, f) = (a + d,b + e,c+ f) ; dodawanie ustalonego elementu (d, e, f) odpowiada wówczas przesunięciu przestrzeni o wektor [d,e, f ]. Natomiast mnożenie trzeba wymyślić.

Trójki liczb, czyli punkty w R3, można też utożsamić z końcami wektorów, zaczepionych w punkcie |O i szukać odpowiedniego mnożenia wektorów. Przywodzi to na myśl znane z zastosowań w mechanice i elektromagnetyzmie pojęcie iloczynu wektorowego v | × w pary wektorów |v,w ∈R3. Wynikiem tego działania jest trzeci wektor, prostopadły do obu wektorów v,w i skierowany w taką stronę, by trójkę wektorów |v,w,v ×w można było ruchem sztywnym przełożyć na dodatnie półosie |Ox,(niekoniecznie prostokątnego) układu współrzędnych. Ponadto, długość wektora v × w powinna być równa polu równoległoboku, rozpiętego przez wektory v,w - łącznie warunki te wyznaczają wektor |v× w w sposób jednoznaczny. Niestety, to nie jest mnożenie, które może nas zadowolić. Z powyższej definicji wynika, że dla dowolnego wektora |v mamy v × v = 0, bo para |v,v rozpina "równoległobok" o zerowym polu. Tymczasem w ciele iloczyn niezerowych elementów jest zawsze różny od zera; jeśli bowiem |a⋅b = 0 oraz a ≠ 0, to istnieje 1/a, skąd dostajemy

b = 1 ⋅b = (-1⋅a) ⋅b = 1-⋅(a⋅b) = 1-⋅0 = 0. a a a

Wykażemy, że w przestrzeni  3 R w ogóle nie ma takiego mnożenia, jakiego szukamy. Dowód poprowadzimy nie wprost. Załóżmy zatem, że istnieje szukane mnożenie, które sprawia, że  3 R staje się ciałem. Wybierzmy dowolny element a ∈R3, który nie należy do prostej zawierającej jedynkę tego ciała i niech P będzie płaszczyzną rozpiętą przez punkty |O, oraz a. W szczególności, dowolny element b ∈ P jest postaci |b = r ⋅1 +s ⋅a dla pewnych liczb r,s ∈R. Rozważymy dwa przypadki:

Przypadek I

Punkt |a2 należy do płaszczyzny P. Wobec tego dla b ,b ∈ P 1 2 mamy

pict

czyli płaszczyzna P jest podzbiorem zamkniętym ze względu na mnożenie.

Ponadto, dla ustalonego b ∈P przekształcenie płaszczyzny |P w siebie, dane wzorem x ( b⋅x, jest różnowartościowym przekształceniem liniowym: jeśli b ⋅x1 = b⋅x2, to |b⋅(x1− x2) = 0, a skoro b ≠ 0, to x1 = x2. Wynika stąd, że obrazem P jest cała płaszczyzna P . W szczególności, istnieje taki element c ∈P , że b ⋅c = 1 ∈P . Wynika stąd, że |P jest dwuwymiarowym podciałem w naszym ciele  3 |R .

Wybierzmy teraz dowolny element d ∈R3, leżący poza płaszczyzną |P. Wówczas podzbiór  ′ P = d ⋅P także jest płaszczyzną. Rozważmy przecięcie P ∩ P′. Załóżmy, że dla pewnych niezerowych |b,b′∈ P mamy |d⋅b = b′. Wówczas d = b ′⋅(1/b) ∈ P, wbrew wyborowi d. Wobec tego |P∩ P ′= {0}, co daje sprzeczność, gdyż w przestrzeni trójwymiarowej dwie płaszczyzny nie mogą przecinać się w dokładnie jednym punkcie.

Przypadek II

Punkt  2 |a nie należy do płaszczyzny P. Wówczas wektory  2 |1,a, a rozpinają przestrzeń |R3, więc a3 = r ⋅1+ s⋅a+ t ⋅a2 dla pewnych liczb |r,s,t ∈R. Wielomian | f(x) = x3 − r− sx− tx2 przyjmuje dla bardzo dużych |x wartości dodatnie, zaś dla "bardzo ujemnych" x - wartości ujemne. Zatem ma on pierwiastek rzeczywisty λ, skąd  f(x) = (x −λ )g(x) dla pewnego trójmianu g(x). Podstawiając do tej tożsamości x = a, otrzymujemy

0 = a3 − r⋅1− s⋅a − t⋅a2 = f (a) = (a − λ⋅1)g(a).

Ale |g(a) ≠ 0, gdyż |a2 /∈ P. Zatem |a =λ ⋅1, wbrew wyborowi a.

W obu przypadkach uzyskaliśmy sprzeczność, co dowodzi, że poszukiwana struktura ciała na przestrzeni |R3 nie istnieje.

To, co nie jest możliwe w przestrzeni trójwymiarowej, może się zdarzyć w wymiarze 4. Na przykład, w przestrzeni R4 składającej się z czwórek liczb rzeczywistych jest dość miejsca na to, by dwie płaszczyzny miały dokładnie jeden punkt wspólny. Oto przykład: niech |P będzie płaszczyzną rozpiętą przez pierwsze dwie osie układu współrzędnych, zaś  ′ P - przez ostatnie dwie. Do płaszczyzny P należą czwórki liczb postaci |(x1,x2,0,0), natomiast do P′ - czwórki (0,0,x3,x4). Jedyną czwórką, która jest obydwu tych postaci, jest, oczywiście, (0,0,0,0), skąd  ′ |P∩ P = {O}.

Hamilton dostrzegł możliwości przestrzeni czterowymiarowej w kontekście rozważanego problemu w dniu 16. października 1843 roku, gdy zmierzając w towarzystwie żony na posiedzenie Royal Irish Academy, przekraczał mostek Broom Bridge na Royal Canal w Dublinie.

Gdy wersory kolejnych osi Oxi, | nazwiemy |1,i, j,k oraz zażądamy, by

 2 2 2 i = j = k = i jk =− 1,

otrzymamy niemal idealne czterowymiarowe ciało!

Hamilton był tak podekscytowany swoim odkryciem, że ponoć wydrapał powyższe formuły na kamiennej poręczy mostu. Historia milczy, jak zareagowała na to zdarzenie towarzysząca mu małżonka.

Odczytajmy z powyższych wzorów wynik mnożenia każdej pary liter |i, j,k. Mnożąc równość |i jk = −1 z prawej strony przez |k, otrzymamy

(i jk)k = −k, (i j)k2 = −k, (i j) ⋅(−1) = −k, i j = k.

Wykonując podobne mnożenie przez |i, ale z lewej strony, otrzymamy | jk = i. Z pierwszej z otrzymanych powyżej równości można wyliczyć | ji:

 ji = j( jk) = j2k = −k.

Wynika stąd, że i j≠ ji, czyli nasze mnożenie nie jest przemienne, co tłumaczy użyte wyżej określenie niemal idealne.

Pozostawiamy Czytelnikom fascynującą zabawę uzyskania kompletu równości:

i j = k, ji =− k, jk = i, k j = −i, ki = j, ik =− j.

Każda czwórka |(x1,x2,x3,x4) ∈R4 może być zapisana jako kwaternion |x = x1 + x2i + x3 j+ x4k. Takie wyrażenia dodajemy po współrzędnych - jak liczby zespolone. Natomiast mnożymy je, otwierając nawiasy i korzystając z sześciu równości przedstawionych wyżej. Tak powstaje algebra kwaternionów , którą na cześć Hamiltona oznaczamy symbolem |H.

Czy każdy niezerowy kwaternion ma element odwrotny? Dla liczb zespolonych pomogło rozważenie iloczynu |(c+ di)(c− di). Tu postąpimy podobnie; gdy uważnie wykonamy mnożenie, otrzymamy

 2 2 2 2 (x1 + x2i + x3 j +x4k) ⋅(x1− x2i− x3 j− x4k) = x1 + x2 + x3 + x4∈ R.

Gdy x jest kwaternionem niezerowym, tj. gdy choć jedna z liczb xi jest różna od zera, suma po prawej stronie jest niezerowa. Gdy wszystkie współczynniki drugiego czynnika w powyższym iloczynie podzielimy przez tę sumę, uzyskamy postać poszukiwanego elementu  −1 x . Zatem |H jest naprawdę ciałem, tyle że nieprzemiennym.

A co w takim razie z wyjściowym celem, jakim było wyrażenie obrotów przestrzeni trójwymiarowej za pomocą mnożenia w odpowiednim ciele? Otóż ten cel też udaje się zrealizować w następujący sposób. Umieśćmy naszą przestrzeń trójwymiarową wewnątrz H, na ostatnich trzech osiach, tj. jako zbiór "czysto urojonych" kwaternionów |x2i + x3 j+ x4k. Niech |u i + u j+ u k 2 3 4 będzie wektorem długości 1, wskazującym oś obrotu, który chcemy zrealizować oraz niech θ będzie kątem, o jaki chcemy obrócić przestrzeń. Rozważmy kwaternion

q = cos(θ/2) + sin(θ /2)⋅(u2i + u3 j+ u4k) ∈ H

oraz przekształcenie H H dane wzorem |x ( q ⋅x ⋅q−1. Łatwo zauważyć, że prosta rozpięta przez wektor |x = u2i + u3 j +u4k nie poruszy się. Okazuje się, że przekształcenie to przeprowadza czysto urojoną podprzestrzeń na siebie i wykonuje na niej dokładnie ten obrót, który sobie zaplanowaliśmy.

Wobec tego każdy obrót przestrzeni trójwymiarowej potrafimy zakodować za pomocą czwórki liczb rzeczywistych. Jest to na tyle efektywne, że kwaterniony znajdują zastosowanie w grafice komputerowej, do kodowania szybkich animacji.