Dołącz do czytelników
Brak wyników

Mózg i umysł , Laboratorium

21 stycznia 2016

Koktajl dźwięków

0 449

Gdy wszyscy goście mówią jednocześnie, nasz mózg pracuje na najwyższych obrotach. Wykorzystuje przeróżne mechanizmy i sztuczki, byśmy mogli usłyszeć właśnie to, co nas interesuje.

W pewnej galerii odbywa się wernisaż znanego artysty. Salę wypełnia tłum miłośników sztuki. W małych grupkach toczą się dyskusje na temat eksponowanych dzieł. Niektórzy po prostu gawędzą na błahe tematy. Ktoś mówi o wystawie, ktoś inny opowiada o swojej ostatniej podróży. Słychać szuranie butów i brzęk kieliszków. Panujący gwar sprawia, że można zrozumieć tylko strzępki rozmów. Przez tłum przeciskają się dwie studentki. Każda niesie plastikową tacę pełną przekąsek. Nagle jedna z nich, mimo że była pochłonięta rozmową ze swoją koleżanką, odwraca głowę. Usłyszała, że znajomy zawołał ją po imieniu. Wyłowiła jego głos z tłumu, jakby w ogóle nie przeszkadzał jej panujący wokół hałas.

Można pomyśleć, że nie ma w tym nic niezwykłego. Sam doświadczyłem czegoś podobnego podczas imprezy z okazji jubileuszu kolegi z pracy czy w trakcie przyjęcia weselnego najlepszej przyjaciółki. Zastanówmy się jednak, co tak naprawdę wydarzyło się na wernisażu. Z ogromu dźwięków studentka zdołała wyłowić informację, która z jej perspektywy była ważna. Jak to możliwe? Nasz mózg posiada pewną niesamowitą zdolność, która ujawnia się na przykład podczas witania wielu gości jednocześnie, w trakcie przyjęcia lub rozmów prowadzonych w dużej grupie. Z ogólnej „paplaniny” potrafimy wtedy wyłowić i przetworzyć tylko najistotniejsze informacje. Jest to tzw. efekt cocktail party.

POLECAMY

Zjawisko to zostało odkryte w 1953 roku przez Colina Cherry’ego (1914–1979), naukowca z Imperial College w Londynie, który jako pierwszy zajął się badaniem zdolności słyszenia w ekstremalnych warunkach akustycznych. W pomieszczeniach, w których panuje hałas, nasz mózg i system słuchowy pracują niezwykle wydajnie. Do dziś inżynierom nie udało się stworzyć urządzenia, które mogłoby konkurować z nami pod tym względem.

Zadanie wyłowienia z gwaru wypowiedzi konkretnej osoby wcale nie jest łatwe. W tym celu mózg analizuje jednocześnie całą gamę parametrów dźwięku i porównuje je z wartościami, które zna z doświadczenia. Co więcej, to wszystko odbywa się „na żywo”. Nie możemy przecież cofnąć taśmy, żeby jeszcze raz „przesłuchać” rozmowy z przyjęcia. Aby sprostać tym wymaganiom, mózg wykorzystuje szereg trików, wielokrotnie przy tym sięgając granic swoich możliwości. Nic więc
dziwnego, że pogorszenie słuchu spowodowane wiekiem lub uszkodzeniem narządu zmysłu zwykle zauważamy dopiero w akustycznym chaosie.

Słuchowy survival
Od ponad 50 lat naukowcy badają, w jaki sposób nasz mózg filtruje i wydobywa pożądane informacje z kłębowiska różnych głosów. Colin Cherry ustalił, że jeśli badany słyszy jednocześnie dwa różne komunikaty, to rozumie treść tylko jednego z nich – najczęściej tego, na którym skupia swoją uwagę. Gdy koncentrujemy się na wypowiedzi jednego z kilku rozmówców, słowa innych osób puszczamy mimo uszu i pozostają niezrozumiałe.

Cherry przypuszczał, że nasz mózg analizuje przede wszystkim kierunek, z którego dociera sygnał akustyczny. Określa zatem, czy słowa pochodzą od rozmówcy siedzącego naprzeciwko, czy od osób siedzących przy sąsiednim stoliku. I rzeczywiście, mózg wykorzystuje tę umiejętność – na przykład podczas przyjęcia. Dociera do nas wtedy z różnych stron wiele głosów, a mimo to potrafimy je od siebie odróżnić.

Efekt cocktail party funkcjonuje nie tylko w stereo. Okazuje się bowiem, że jesteśmy w stanie rozróżnić głosy wielu wykonawców piosenki, nawet gdy pochodzą one z nagrania, które zostało zarejestrowane w mono, czyli przy użyciu jednego mikrofonu.

Jeszcze bardziej ekstremalną sytuację stanowi rozmowa telefoniczna – w tym przypadku nie ograniczamy się tylko do pojedynczego źródła dźwięku. Jednym uchem słuchamy rozmówcy po drugiej stronie słuchawki, drugim jednak odbieramy przeróżne dźwięki i rozmowy z naszego bezpośredniego otoczenia. Pomimo tego „rozdwojenia” potrafimy odróżnić rozmaite odgłosy – dzieci przyjaciółki wrzeszczące do słuchawki po drugiej stronie albo partnera, który siedzi obok i robi nam wyrzuty, że za długo rozmawiamy.

Oprócz kierunku mózg potrafi analizować również inne cechy dźwięku, dzięki którym może zlokalizować jego źródło. Co więcej, jest w stanie przyporządkować dobiegające do uszu słowa do poszczególnych rozmówców.
W 1990 roku Albert Bregman, psycholog z McGill University w Montrealu, na podstawie wieloletnich badań psychoakustycznych stworzył pojęcie tzw. obiektów słuchowych, czyli spójnych reprezentacji dźwięku. Obiekty słuchowe można porównać do przedmiotów, które spostrzegamy zmysłem wzroku. Obiekt wzrokowy to taki, który widzimy i potrafimy odróżnić od innych. Analogicznie, obiekt słuchowy to zdarzenie o charakterze akustycznym, które spostrzegamy, analizując szerszą scenę słuchową. Może to być czysty dźwięk dzwonka do drzwi lub coś bardziej złożonego, np. mówiony tekst. Według teorii Bregmana, która została potwierdzona licznymi eksperymentami, mózg rozpoznaje obiekty słuchowe na podstawie ich cech fizycznych, czyli częstotliwości dźwięku, natężenia oraz prędkości, z jaką narasta i opada.

Proste sygnały akustyczne, składające się na mowę, posiadają szereg charakterystycznych cech, które nasz mózg rozróżnia i przetwarza. Na przykład niski głos mężczyzny różni się od piskliwego głosu dziecka przede wszystkim częstotliwością – podczas gdy głos mężczyzny rozbrzmiewa z częstotliwością 100 Hz, młody głosik osiąga aż 400 Hz.

Dźwięczne elementy mowy, które są odpowiedzialne za wysokość dźwięku docierającego do naszych uszu oraz barwę głosu, który słyszymy, wykazują ponadto tzw. harmoniczną strukturę częstotliwości. Oznacza to, że głos mężczyzny nie wibruje stale z częstotliwością 100 Hz, lecz również z jej wielokrotnością – 200 Hz, 300 Hz itd. Dodatkowo, posiada regularne wahania amplitudy w czasie. Innymi słowy, przebieg fal dźwiękowych wywołanych przez głos o częstotliwości podstawowej 100 Hz powtarza się sto razy na sekundę. To oznacza, że dźwięk przybiera na sile i spada do poziomu wyjściowego sto razy na sekundę. Naukowcy nazywają to zjawisko okresowością.

Tort czy fortepian?
Naukowcy z Kliniki Laryngologicznej na Universität Erlangen-Nürnberg oraz z Leibniz-Institut für Neurobiologie w Magdeburgu prowadzili badania na myszoskoczkach mongolskich. Te azjatyckie gryzonie doskonale sprawdzają się w eksperymentach dotyczących słuchu, ponieważ ich system słuchowy funkcjonuje podobnie jak nasz. Przede wszystkim słyszą w zakresie częstotliwości, w którym mieści się także ludzka mowa. Z kolei np. szczury lub myszy domowe słyszą wyłącznie ultradźwięki.

Niemieccy naukowcy zbadali, jak reagowały neurony kory słuchowej myszoskoczków, gdy słuchały one jednocześnie dwóch różnych harmonicznie dźwięków. Posłużyły one jako model harmonicznych dźwięków mowy. Badacze zmieniali częstotliwość, okresowość i natężenie dźwięków. Jednocześnie obserwowali reakcje ich komórek nerwowych. W ten sposób opracowali tzw. topograficzne mapy kory słuchowej myszoskoczków. Pokazują one, które obszary mózgu są aktywne, gdy do uszu docierają różne sygnały.

W najprostszej sytuacji – gdy system słuchowy przetwarza czyste dźwięki, np. pojedynczy ton wytworzony elektrycznie – w korze słuchowej uaktywniają się tzw. mapy tonotopowe. Nauka zna je już od dawna. Odzwierciedlają reakcje komórek nerwowych na częstotliwość sygnału dźwiękowego. Obszary mózgu, które reagują na różne zakresy częstotliwości, leżą w różnych miejscach – niczym klawisze fortepianu (patrz grafika A). I tak jak w fortepianie, obszary reprezentujące sąsiednie zakresy leżą tuż obok siebie, natomiast te, które reprezentują odległe zakresy częstotliwości, są od siebie oddalone.

W 2002 roku niemieccy badacze odkryli, że kora słuchowa myszoskoczków zawiera nie tylko mapy częstotliwości, ale również mapy odzwierciedlające okresowość dźwięku, czyli jego regularne narastanie i opadanie. Okazało się, że nie były one uporządkowane linearnie, jak na klawiaturze. Tym razem stwierdzili, że obszary, które reprezentują zbliżone okresy, są ułożone koliście, niczym kawałki tortu.

Naukowcy przypuszczali, że mapy okresowości są kluczem do zrozumienia efektu cocktail party. Głosy poszczególnych osób charakteryzują się specyficzną podstawową częstotliwością oraz różną okresowością. Pojedynczy kawałek „tortowej mapy” w korze słuchowej reprezentuje indywidualnego rozmówcę. Im więcej osób o różnej barwie głosu mówi jednocześnie, tym więcej kawałków tortu zo...

Ten artykuł dostępny jest tylko dla Prenumeratorów.

Sprawdź, co zyskasz, kupując prenumeratę.

Zobacz więcej

Przypisy