Mała Delta
Ogródek Gardnera
Hexapawn, czyli czego można nauczyć pudełka
Zamiast analizować, czy gra jest sprawiedliwa, czy nie, zamiast szukać najlepszych strategii graczy, można stworzyć pewną maszynę, która część tej pracy wykona za nas. Trzeba jej objaśnić zasady, a potem z nią grać, niekoniecznie najlepiej - w końcu jeszcze nie przeanalizowaliśmy gry. Maszyna, grając, zapamiętując i wyciągając wnioski z przegranych oraz wygranych (co śmiało można zakwalifikować jako uczenie się), prędzej czy później zorientuje się, jak grać możliwie najlepiej, a więc ogrywać nas, o ile to tylko możliwe.
Instrukcja gry Hexapawn dla ludzkich graczy. Gra rozgrywa się na szachownicy Początkowe ustawienie przedstawia powyżej. Dwaj gracze (pierwszy - biały, drugi - czarny) ruszają się na przemian. W każdym ruchu gracz rusza się jednym ze swoich pionków jedno pole do przodu lub, jeżeli ma taką możliwość, może (nie musi) wykonać bicie pionka przeciwnika jedno pole po skosie do przodu. Wygrywa ten gracz, który jako pierwszy dotrze swoim pionkiem na przeciwną stronę szachownicy (na jedno z pól, z których grę rozpoczynał przeciwnik) lub który uniemożliwi jakikolwiek ruch przeciwnikowi (zbije wszystkie jego pionki bądź go zablokuje).
Instrukcja gry dla maszyny.
Droga Maszyno, w każdym swoim ruchu (jesteś graczem drugim, czarny kolor pionków) możesz znaleźć się w jednej z sytuacji przedstawionych na rysunkach poniżej. Masz wtedy do dyspozycji tylko te ruchy, które są oznaczone strzałkami. Wybierasz jeden z dostępnych Ci ruchów. Następnie rusza się gracz biały. Po nim ponownie wykonujesz Twój ruch, znowu wybierasz strzałkę, aż... znajdziesz się w sytuacji, której nie ma na rysunku, oznacza to koniec gry.Powodzenia, Maszyno!
Instrukcja techniczna gry (dla nauczyciela maszyny). Maszyna składa się z 24 pudełek, każde opatrzone etykietą (rysunek powyżej) przedstawiającą sytuację, która może zaistnieć w grze oraz możliwe do wykonania w tej sytuacji ruchy (kolorowe strzałki). Do każdego pudełka należy włożyć koraliki w kolorach odpowiadających strzałkom. W każdym pudełku znajdzie się tyle koralików, ile strzałek jest na jego etykietce, w kolorach takich jak strzałki. W parzystych ruchach należy odszukać pudełko z odpowiadającą grze sytuacją, a następnie losowo wykonać ruch (wylosować koralik i wykonać takie posunięcie, jakie przedstawia strzałka w jego kolorze). Koralik należy zostawić przed pudełkiem aż do końca partii.
Jeżeli grę wygra maszyna, wkładamy wszystkie wyjęte podczas partii koraliki z powrotem do odpowiednich pudełek. Jeżeli grę wygra gracz biały, usuwamy z ostatniego użytego pudełka wylosowany koralik (odpowiadający ostatniemu w grze ruchowi maszyny). Rozpoczynamy kolejną grę z jednym koralikiem mniej lub z taką samą liczbą koralików. Usunięcie koralika z ostatniego pudełka będzie skutkować tym, że kiedy maszyna ponownie znajdzie się w analogicznej sytuacji, nie wykona ruchu, który wcześniej doprowadził ją do przegranej (pamięta porażki).
Jeżeli pudełko zostanie puste, usuwamy je z maszyny. Jeżeli maszyna znajdzie się w takiej sytuacji, oznacza to, że nie może wykonać żadnego ruchu, należy traktować to jako jej przegraną (mimo że według reguł dla ludzkich graczy istnieją dozwolone ruchy).
Opisaną metodą będą sukcesywnie eliminowane wszystkie ruchy prowadzące do przegranej drugiego gracza. Pozostaną tylko posunięcia nieprowadzące do przegranej. Jak łatwo się przekonać, maszyna staje się mądrzejsza tylko po przegranej partii. Po dokładnie 11 przegranych (co oznacza około 40 gier z myślącym przeciwnikiem) maszyna nauczy się ogrywać nas zupełnie (w grze Hexapawn strategię wygrywającą ma drugi gracz). Nauka będzie tym szybsza, im lepszy przeciwnik maszyny.
Nieco szerzej. Gra Hexapawn została wymyślona przez Martina Gardnera w celu zilustrowania prostego działania maszyny samouczącej się, co opisał w rubryce Mathematical Games w Scientific American w marcu 1962. Maszynę nazwał HER (ang. Hexapawn Educable Robot) i stworzył dla niej partnera, samouczącego się robota HIM (ang. Hexapawn Instructable Matchboxes), który był graczem wykonującym pierwszy ruch (i wszystkie nieparzyste) w ich wspólnych partiach.
Maszyna może być zaprojektowana w nieco inny sposób. Jeżeli zależy nam nie na tym, aby jak najszybciej stała się mistrzem, lecz na tym, żeby np. przegrała jak najmniejszą liczbę partii podczas 20 rozgrywek, wtedy warto nie tylko karać (wyjmując koraliki), ale nagradzać za wygraną poprzez dokładanie koralików w odpowiednich kolorach do wszystkich pudełek użytych w wygranej rozgrywce.
Analogiczne maszyny mogą zostać zbudowane do rozgrywania innych gier. Pierwsza tego typu maszyna rozgrywała grę kółko i krzyżyk, składała się z 300 pudełek. Została opisana w 1961 roku przez Donalda Michie, biologa z Uniwersytetu w Edynburgu.