Dołącz do czytelników
Brak wyników

inne , Laboratorium

22 stycznia 2016

CoRA złota rączka

0 368

Roboty biją nas na głowę w wielu dziedzinach: nie czują zmęczenia, błyskawicznie liczą, szybko uczą się dziesiątek tysięcy słów. Ale ustępują trzyletniemu dziecku jeśli chodzi o sprawność dłoni. CoRA ma to zmienić.

To właśnie dłoń i jej sprawność czyni nas ludźmi. Dzięki niej potrafimy wkręcić mikroskopijną śrubkę z zamkniętymi oczami. Jesteśmy w stanie odnaleźć spinkę w gąszczu różnych rzeczy w torebce – trafiamy na nią, nie patrząc i nie przerywając rozmowy z koleżanką. Nawet nie zdajemy sobie sprawy z tego, jak złożone ruchy przy tym wykonujemy. Sięgamy po uszko kruchej porcelanowej filiżanki, wypełnionej po brzegi herbatą, i niesiemy ją do ust, nie roniąc ani kropli. Przychodzi nam to naturalnie, mimochodem. Ręka jakby sama trafia na filiżankę, sama dostosowuje odstęp między palcami do grubości porcelanowego uszka, siłę nacisku do kruchości materiału. Ściskamy uszko dostatecznie silnie, by filiżanka nie wysunęła się z dłoni, ale nie za silnie – by nie ułamać uszka, a przy tym utrzymujemy naczynie w równowadze. Mistrzostwo świata w tej dziedzinie osiągamy bez wysiłku i namysłu.

O tym, jak złożone procesy kryją się za tymi pozornie prostymi ruchami, przekonują się badacze sztucznej inteligencji. Od lat próbują stworzyć maszyny, które potrafiłyby robić to, co my: rozpoznać rzecz, chwycić ją, trafiać do celu i tym podobne działania. Jak dotąd, udaje im się to ze średnim skutkiem. Przyznają: choć potrafimy stworzyć komputery, które pokonują szachowych arcymistrzów i są lepsze od nas w operacjach logicznych i planowaniu, to już trzyletnie dziecko jest sprawniejsze ruchowo niż najlepsze nawet maszyny. Dlaczego? W czym tkwi trudność?

POLECAMY

Największą zaletą ludzkiego układu narządów ruchu jest jego elastyczność. Dzięki niej bez problemu dostosowujemy nasze zachowanie do wciąż zmieniającego się otoczenia. Tego właśnie nie potrafią roboty. Co prawda przetwarzają nawet najbardziej złożone informacje dotyczące kształtu i położenia obiektów, a ich precyzja przewyższa ludzką, jednak nie potrafią sięgnąć po dowolną rzecz i użyć jej do wykonania jakiejś czynności.

Wciąż jesteśmy mistrzami w wykonywaniu skomplikowanych ruchów, za każdym razem zmieniając je i dostosowując do okoliczności. Nie mamy w tym sobie równych. Ale to się zmienia.

Tajemnica snajperów
Być może krokiem, który pozwoli przekroczyć tę barierę, jest człekopodobny robot CoRA (ang. Cooperative Robot Assistant). Zastosowano w nim rozwiązania oparte na zasadach działania układu ruchu człowieka. Android wyposażony jest w dwie kamery oraz mikrofon, dzięki czemu rozpoznaje przedmioty, gesty, słowa, a nawet potrafi patrzeć w tym samym kierunku co człowiek, z którym współpracuje. Głowa robota porusza się w górę, w dół i na boki. Robot dysponuje – jak to określają badacze – dwoma „stopniami wolności”.

„Ciało” robota to ramię zamontowane na pionowym, obrotowym, przymocowanym do specjalnego blatu tułowiu. Ramię to jest w dużym stopniu samodzielne, dysponuje aż siedmioma „stopniami wolności” – pod tyloma kątami może się poruszać (ASIMO, android zbudowany przez Hondę, dysponuje aż 26 stopniami swobody (por. s. 59). Dzięki temu CoRA jest w stanie wykonać szereg prac, podczas których może dowolnie zmieniać ustawienie swojego ramienia, nie zmieniając jednocześnie pozycji samej „dłoni”. Poprzez obrócenie tułowia, CoRA zmienia się z robota praworęcznego w leworęcznego – w zależności od tego, którą ręką posługuje się jego partner.

Projektując CoRA, badacze korzystali z wiedzy zgromadzonej przy okazji analiz ruchu człowieka strzelającego z pistoletu. Już w latach 30. ubiegłego wieku rosyjski naukowiec Mikołaj Bernstein zaobserwował, że strzelając raz po raz do tego samego celu, człowiek za każdym razem przyjmuje nieco inną pozę. Przy każdym strzale stawy jego ręki układają się nieco inaczej. Dzieje się tak zarówno w przypadku początkujących strzelców, jak i mistrzów w strzelaniu z pistoletu. U jednych i drugich podczas kolejnych strzałów nieznacznie zmienia się pozycja ramienia i dłoni. Dlaczego zatem wprawni snajperzy trafiają częściej?

Wspólnie z Johnem Scholzem z University of Delaware i Markiem Latashem z Penn State University uchyliliśmy rąbka tej tajemnicy. Podczas testów odkryliśmy, że profesjonaliści lepiej potrafią koordynować różne pozycje stawów ręki, tak aby znaleźć najlepsze w danym momencie ułożenie pistoletu względem celu.

Aby zastosować podobne rozwiązania w robotach, najpierw trzeba zrozumieć, jak nasz układ nerwowy przetwarza informacje o celu ruchu i zależnie od niego steruje naszymi ruchami.

Widzę ukrytą filiżankę
Działamy zazwyczaj pod kontrolą wzroku. Dostosowujemy nasze ruchy do informacji, które napływają z układu wzrokowego. Jeśli na przykład sięgamy po filiżankę stojącą na biurku, kierujemy się jej aktualnym obrazem. Równocześnie jednak obraz filiżanki – względnie stabilny – tworzy się w mózgu. Dzięki temu możemy sięgnąć po nią, nawet gdy jej nie widzimy, bo ukryta jest pod stosem notatek. Trafiamy bezbłędnie, nie patrząc, wyciągając rękę „na pamięć”. Umysłowy obraz filiżanki jest wielozmysłowy, dlatego potrafimy określić jej miejsce na podstawie odgłosu nalewanej herbaty lub poprzez dotykanie powierzchni stołu, aż poczujemy gładkość porcelany. Kiedy to robimy, za każdym razem w naszym mózgu powstaje abstrakcyjny plan ruchów.

Schemat działania jest gotowy; niezależnie od tego, czy go wykonujemy, czy nie. Komórki nerwowe z obszaru kory ruchowej i pierwszorzędowej kory ruchowej nadzorują nasz ruch i jego kierunek. Przy czym nie działamy według ustalonego raz na zawsze schematu, lecz za każdym razem dopasowujemy swoje ruchy do sytuacji, nawet już w trakcie ich wykonywania. W tym właśnie tkwi zasadnicza różnica między naszymi działaniami a ruchami robota.
Badacze próbują matematycznie opisać procesy, które kierują naszymi ruchami, a następnie dokonują symulacji ruchów, wykorzystując uproszczone modele działania układu nerwowego. Użyte w komputerach sztuczne sieci neuronów do pewnego stopnia przypominają strukturę naszej kory mózgowej. Zbudowana jest ona z wielu warstw. Sąsiadujące neurony współpracują ze sobą, wykonując podobne zadania. Są to tzw. pola neuronalne. One rozpoznają znaczenie informacji zmysłowej, one wyznaczają kierunek, w jakim porusza się ręka. I określają ważność tego ruchu.

Gdy chcemy sięgnąć po filiżankę, by napić się herbaty, pole neuronalne analizuje stan podstawowy, czyli dotychczasową wiedzę na ten temat. Pozwala to ustalić konkretny cel ruchu, chociaż nie do końca. Napływające informacje, na przykład wzrokowe, mogą wywołać zmiany w polu neuronalnym. Dostrzegamy, że w filiżance jest kawa, nie herbata. Albo ślad szminki na brzegu naczynia wskazuje, że ktoś inny pił z tej filiżanki. Zawsze też pozostaje margines niepewności, do końca mamy wybór. Na co dzień często stajemy przed wyborem, co zrobić. Podejść do szafy czy iść do garderoby w korytarzu? Wziąć kluczyki do samochodu czy klucze do domu? Okazuje się, że nie zawsze wybieramy świadomie i w zamierzony sposób. Część bodźców wzrokowych nie dociera do naszej świadomości, a mimo to mają one wielki wpływ na nasze zachowanie. Nieświadomie podążamy za naszymi oczami.

Zwycięzca może być tylko jeden
Podczas eksperymentów w laboratorium można przyjrzeć się dokładnie ruchom skokowym oczu – tzw. ruchom sakkadowym. To one sprawiają, że kierunek naszego spojrzenia zmienia się automatycznie kilka razy na sekundę. Oczy mimowolnie wychwytują to, co się dzieje i dostosowują się do tego. Jeśli badana osoba odkrywa świecący zielony punkt na obrzeżu pola widzenia, to w następstwie ruchu sakkadowego oczu staje się on nagle centrum tego pola. A co się wydarzy, gdy na obrzeżach pola widzenia pojawią się jednocześnie punkty zielony i czerwony? Który z nich przejmie naszą uwagę?
Sprawdzono to eksperymentalnie. I okazało się, że nawet gdy osobie badanej polecono, by wpatrywała się ciągle w zielony punkt, to i tak połowie badanych mimo polecenia wzrok „ześlizgiwał się” na punkt czerwony. Przyciągał ich niczym magnes. Dowodzi to, że decyzja o tym, gdzie skierować wzrok, zapada na poziomie neuronalnym, w bardzo wczesnym etapie przetwarzania informacji wzrokowej, gdy kolor światła nie odgrywa roli.

W jaki sposób spośród wielu dostępnych celów wybieramy ten jeden – cel naszego ruchu? Można to wyjaśnić...

Ten artykuł dostępny jest tylko dla Prenumeratorów.

Sprawdź, co zyskasz, kupując prenumeratę.

Zobacz więcej

Przypisy