Iluzje rzeczywistości: Jak mózg konstruuje nasze spostrzeżenia

percepcja

Czy możemy ufać własnym zmysłom? Na pierwszy rzut oka wydaje się, że nasze oczy i uszy wiernie rejestrują świat. Widzimy przecież kolory, kształty, słyszymy dźwięki. A jednak każdy z nas doświadczył złudzeń optycznych lub sytuacji, gdy umysł “dopowiadał” rzeczywistość. Ludzka percepcja to złożony, aktywny proces interpretacji danych zmysłowych, a nie prosty zapis obrazu i dźwięku niczym kamera czy dyktafon. Nasz mózg niczym artysta tworzy obraz świata na podstawie niepełnych i zniekształconych sygnałów zmysłowych. Dodaje znaczenia, koryguje błędy i uzupełnia luki. W efekcie “widzimy i “słyszymy” nie tylko to, co dociera do oczu i uszu, ale także to, czego spodziewamy się doświadczyć.

Dlaczego tak się dzieje? Odbędziemy podróż przez ludzką percepcję – od momentu, gdy bodziec dociera do narządu zmysłu, poprzez etapy kodowania i rozpoznawania w mózgu, aż po fascynujące fenomeny wyższego rzędu. Rozpoznawanie twarzy, stałość spostrzegania, wpływ kontekstu i oczekiwań, a także złudzenia i efekty deprywacji sensorycznej. Zobaczymy, że to, co wydaje się oczywiste dla naszych zmysłów, jest efektem złożonej pracy mózgu, który stale balansuje między przetwarzaniem oddolnym (dół–góra) a odgórnym (góra–dół). Artykuł odpowie m.in. na pytania: Jak rozpoznajemy obiekty i twarze? Co się dzieje w mózgu, gdy patrzymy na świat? Dlaczego ulegamy złudzeniom? Zapraszam do lektury, która odsłoni tajemnice naszego zmysłowego umysłu.

percepcja

Percepcja, spostrzeganie i wrażenia, czyli fundamenty procesu

Na początku wyjaśnijmy kluczowe pojęcia. Percepcja (spostrzeganie) to ogół procesów poznawczych, dzięki którym odbieramy i interpretujemy informacje zmysłowe. Obejmuje zarówno recepcję sensoryczną, czyli odbiór surowych danych przez narządy zmysłów, jak i ich interpretację w kontekście naszej wiedzy i doświadczeń. Innymi słowy, percepcja to więcej niż same wrażenia; to aktywny proces nadawania znaczenia bodźcom. Jak ujęto w jednym z podręczników, percepcja polega na połączeniu danych zmysłowych z posiadaną wiedzą, co umożliwia identyfikację obiektów.

Z kolei wrażenia zmysłowe (sensacje) to podstawowe informacje dostarczane przez zmysły, np. plamka koloru, dźwięk o określonej częstotliwości. Spostrzeżenie powstaje dopiero, gdy mózg połączy te wrażenia w całościowy obraz obiektu. Przykładowo, patrząc na jabłko, receptory wzrokowe odnotowują okrągły kształt, czerwonawy kolor, połysk (to wrażenia), ale dopiero skojarzenie tych cech z pamięcią pozwala rozpoznać, że to jabłko – oto spostrzeżenie.

W procesie percepcji ważne jest rozróżnienie między bodźcem dystalnym a proksymalnymBodziec dystalny to obiekt lub zjawisko w świecie zewnętrznym, który jest źródłem bodźca (np. drzewo, które widzimy; telefon, który dzwoni). Bodziec proksymalny zaś to bezpośredni bodziec działający na nasze narządy zmysłów, czyli obraz na siatkówce oka utworzony przez światło odbite od drzewa, czy fale dźwiękowe docierające do ucha z głośnika telefonu. Co ważne, bodziec proksymalny jest zazwyczaj zniekształcony i niepełny w porównaniu z rzeczywistym obiektem, np. obraz na siatkówce jest odwrócony do góry nogami, pomniejszony i nieostrawy na obrzeżach, bo siatkówka jest zakrzywiona i niejednorodna. Mózg jednak koryguje te zniekształcenia. Wykorzystuje pamięć i doświadczenie, by przekształcić chaotyczny obraz siatkówkowy w stabilne spostrzeżenie obiektu. Dlatego świat nie jawi nam się jako “do góry nogami” czy rozchwiany, choć fizycznie taki obraz powstaje na naszych receptorach wzroku.

W efekcie, jak sugerują psychologowie, noworodek widzi świat inaczej niż dorosły – pozbawiony doświadczeń, odbiera jedynie chaos barw i kształtów (właśnie bodźce proksymalne), nie mając jeszcze wykształconych mechanizmów interpretacji. Stopniowo uczy się on, jakie znaczenie mają te wzorce bodźców, gdzie kończy się jeden obiekt, a zaczyna drugi, co jest ważne, a co można zignorować.

Oddolne i odgórne przetwarzanie – dane kontra oczekiwania

Wspomnieliśmy, że percepcja łączy dane zmysłowe z wiedzą i oczekiwaniami. W literaturze mówi się o tym jako o dwóch kierunkach przetwarzania informacji w mózgu. Przetwarzanie oddolne (bottom-up) to analiza wychodząca od danych sensorycznych. Mózg odbiera sygnały z receptorów i składa je w całość bez wcześniejszych założeń. Jest to podejście “dane napędzają wnioski“, np. widząc nieznany kształt, pozwalamy, by szczegóły bodźca (linia tu, zakrzywienie tam) zdeterminowały, co zobaczymy. W czystej postaci bottom-up zachodzi rzadko, bo mózg prawie zawsze coś “wie z góry”, ale ten tryb dominuje przy bardzo nowych lub jednoznacznych bodźcach.

Przetwarzanie odgórne (top-down) przeciwnie. To wpływ naszych oczekiwań, doświadczeń i wiedzy na interpretację bodźców. Umysł nie czeka biernie, aż dane “same się ułożą”. Jeśli na przykład oczekujemy zobaczyć konkretne zjawisko, nasz mózg “nastawia się” na nie – i może je dostrzec nawet przy skąpych przesłankach. Znane eksperymenty pokazują to dobitnie. W jednym z nich uczestnikom pokazywano na moment znak graficzny, który mógł być odczytany jako litera „B” albo cyfra „13”. Gdy umieszczono go w ciągu liter (A _ C), badani czytali go jako „B”, a gdy w ciągu cyfr (12 _ 14), jako „13”, mimo że bodziec był fizycznie identyczny. Kontekst i oczekiwania zmieniły spostrzeżenie. Podobnie w klasycznym eksperymencie Bugelskiego i Alampaya (1961), pokazano ludziom serię rysunków zwierząt albo ludzi, a potem dwuznaczny obraz tzw. “człowiek-szczur”. Ci po serii zwierząt częściej widzieli na obrazku szczura, a po serii twarzy – człowieka. Tak działa nastawienie percepcyjne – nasze uprzednie doświadczenie “programuje mózg, by widział to, co jest zgodne z oczekiwaniem.

neuromarketing

Top-down i bottom-up w percepcji stale się przeplatają. Najpierw bodźce dostarczają surowego materiału (oddolnie), a następnie mózg dopasowuje je do wzorców pamięci i nadaje znaczenie (odgórnie). Gdy czytamy tekst, oczy rejestrują kształty liter (bottom-up), ale to znajomość języka sprawia, że rozumiemy słowa – i np. możemy nie zauważyć literówki, bo nasz umysł spodziewa się poprawnego zdania (top-down). Percepcja jest więc ciągłym tańcem danych i interpretacji.

Głębia widzenia – bodźce dwuoczne i jednooczne

Świat, który odbieramy wzrokiem, jest trójwymiarowy. Potrafimy ocenić, co jest blisko, a co daleko, widzimy przestrzeń. Tymczasem nasze oczy otrzymują obraz dwuwymiarowy (na siatkówce). Jak zatem mózg rekonstruuje trzeci wymiar? Służą mu do tego rozmaite wskazówki głębi. Dzielimy je na dwuoczne (binokularne) – wymagające użycia obojga oczu oraz jednooczne (monokularne), działające nawet przy patrzeniu jednym okiem.

Do najważniejszych wskazówek dwuocznych należy dwuoczna paralaksa (rzędna obrazów siatkówkowych). Ponieważ nasze oczy są oddalone od siebie o kilka centymetrów, każde widzi świat pod nieco innym kątem. Dla bliskich obiektów różnica między obrazami w lewym i prawym oku jest wyraźna, to tzw. retinalna dyspartycja. Mózg analizuje te różnice i na tej podstawie wyczuwa odległość. Jeśli obraz w obu oczach różni się bardzo, przedmiot musi być blisko (oczy patrzą na niego pod różnym kątem), a jeśli różnice są niewielkie – obiekt jest daleko. To zjawisko nazywamy stereopsją. Jest głównym źródłem wrażenia głębi przy patrzeniu obojgiem oczu. Dodatkowo, przy bardzo bliskich obiektach odczuwamy konwergencję – ruch gałek ocznych zbiegających się, gdy patrzymy na czubek nosa. Napięcie mięśni poruszających oczy służy mózgowi jako wskazówka odległości (choć tylko dla obiektów do kilku metrów).

Wskazówki jednooczne to takie, które działają w pojedynczym obrazie. Artyści od wieków je stosują, by na płótnie oddać głębię:

  • Perspektywa linearna – równoległe linie (jak tory na drodze) zbiegają się w dali. Gdy widzimy zbieżność linii, interpretujemy to jako głębię, np. ulica zwęża się ku horyzontowi.
  • Rozmiar i wysokość na obrazie – obiekty dalsze rzutują mniejsze obrazy na siatkówce. Jeśli znamy realny rozmiar czegoś (np. człowieka), a widzimy malutką sylwetkę, wnioskujemy, że stoi daleko. Również to, co bliżej horyzontu (wyżej w polu widzenia), wydaje się dalsze, bo bliższe przedmioty zwykle są niżej w naszym obrazie (choć to związane z perspektywą).
  • Zasłanianie (okluzja) – jeśli jeden obiekt częściowo przesłania drugi, to ten przesłaniający jest bliżej. To prosta i bardzo silna wskazówka. Na zdjęciu, gdzie postać stoi przed samochodem, od razu wiemy, że człowiek jest przed autem, bo zakrywa jego fragment.
  • Gradient tekstury i szczegółów – powierzchnie mające fakturę (np. pole kwiatów, bruk) wydają się gęstsze i mniej wyraźne w oddali. Im coś dalej, tym drobniejsze i ciaśniej upakowane szczegóły widzimy, co nasz mózg interpretuje jako odległość.
  • Perspektywa powietrzna (aerialna) – dalsze obiekty (góry na horyzoncie) są bardziej zamglone, niebieskawe, mniej kontrastowe z powodu atmosfery. Dlatego odległe szczyty wydają się jaśniejsze, zamglone, to również wskazówka odległości.
  • Cienie i światło – cień rzucany przez przedmiot oraz gradient oświetlenia mówią nam o jego przestrzennym kształcie i położeniu. Np. światłocień pozwala rozpoznać wypukłość lub wklęsłość, mózg zakłada zwykle, że światło pada z góry, więc część zacieniona oznacza wgłębienie, a rozświetlona – wypukłość. Artyści malują trójwymiarowe złudzenia (trompe l’oeil) właśnie dzięki odpowiedniemu cieniowaniu.

Wszystkie te wskazówki działają razem. Nasz mózg zintegrował je w efektywny system oceniania głębi. Co ciekawe, można je oszukać, co prowadzi do spektakularnych złudzeń. Przykład to pokój Amesa. Specjalnie zbudowana pokój-pułapka, gdzie przy pomocy zniekształconej perspektywy osoba stojąca w jednym rogu wydaje się olbrzymem, a w drugim – karłem. Mózg interpretuje obraz pokoju jako prostokątny (bo tego się spodziewa), wobec czego różnice odległości przekłada na wielkość postaci – i powstaje iluzja. Podobnie iluzja Ponzo. Dwie równej długości kreski narysowane na tle zbieżnych linii (jak tory kolejowe) – górna wydaje się dłuższa, bo nasz umysł interpretuje ją jako dalszą (w perspektywie), a skoro rzutują na siatkówkę jednakową długość, to faktycznie dalsza musiałaby być większa. Nasza wiedza o stałości wielkości i perspektywie sprawia, że widzimy coś, czego nie ma.

mózg

Rozpoznawanie obiektów – od bodźca do znaczenia

Gdy już bodziec wzrokowy zostanie odebrany, np. widzimy na siatkówce zbiór konturów i kolorowych plam, pojawia się kolejne pytanie. Jak rozpoznajemy, co to za obiekt? Proces ten fascynuje badaczy od dekad. Wyobraźmy sobie pokój pełen różnych przedmiotów. Nasz mózg musi wyodrębnić poszczególne obiekty z tła (segmentacja), a następnie przypisać im tożsamość (rozpoznanie). W psychologii poznawczej powstało wiele modeli tłumaczących, jak tego dokonujemy. Skupmy się na dwóch kluczowych – teorii widzenia Marr’a oraz teorii geonów Biedermana.

Model Marr’a – szkice od prymitywów do 3D

David Marr był wybitnym badaczem, który w latach 70. zaproponował kompleksową teorię widzenia w kategoriach obliczeniowych. Według Marr’a nasz system wzrokowy przechodzi przez kilka reprezentacji obrazu, stopniowo wyodrębniając kształty i strukturę obiektów. Proces ten można opisać w trzech głównych etapach:

  • Szkic pierwotny (primal sketch) – to wstępna, niskopoziomowa reprezentacja obrazów. Mózg wykrywa w obrazie podstawowe cechy, jak lokalne zmiany jasności, krawędzie, kąty, punkty. Innymi słowy, tworzony jest rodzaj “mapy” najważniejszych konturów i cieni na podstawie obrazów siatkówkowych. Marr postulował, że używa do tego zestawu prostych “tokenów” – prymitywnych elementów typu krawędź, pasek, plamka o określonej orientacji, długości, kontraście itd. To trochę jak “szkic ołówkiem“, zarysowuje, gdzie coś się zaczyna i kończy w obrazie. Szkic pierwotny oczyszcza obraz z wpływu oświetlenia czy tekstur, ma uwidocznić geometrię sceny.
  • Szkic 2½-wymiarowy (2½D) to kolejny etap, w którym mózg uwzględnia głębię i orientację powierzchni widocznych dla obserwatora. Marr nazwał go “2½D”, bo reprezentuje już powierzchnie w przestrzeni (z informacją, która część jest bliżej, pod jakim kątem nachylona), ale wciąż z punktu widzenia obserwatora (nie jest to jeszcze pełny model 3D niezależny od punktu widzenia). W tym etapie integrowane są m.in. wskazówki głębi, dzięki czemu mózg wie, że np. dana krawędź to granica obiektu, a za nią jest inny obiekt dalej. Szkic 2½D zawiera informacje o odległości fragmentów, ciągłości powierzchni i przerwach (granice obiektów). Można go sobie wyobrazić jak relief – płaskorzeźbę sceny widzianą oczami obserwatora.
  • Reprezentacja trójwymiarowa (model 3D) to ostatnia faza, w której mózg tworzy pełnoprawny, trójwymiarowy opis obiektu w przestrzeni. Tutaj następuje przekształcenie od opisu zależnego od naszego punktu widzenia do opisu obiektywnego. Niezależnego od tego, skąd patrzymy. Model 3D jest hierarchiczny i modularny. Według Marr’a obiekty są reprezentowane jako złożenia elementarnych brył (walce, prostopadłościany itp.) zorganizowanych względem siebie. To już wewnętrzna reprezentacja, którą możemy porównać z bazą obiektów w naszej pamięci. Marr sugerował istnienie w umyśle katalogu modeli 3D – swoistej “biblioteki”, gdzie przechowywane są opisy kształtów znanych obiektów, zorganizowane hierarchicznie od ogólnych zarysów po detale. Rozpoznanie polega na dopasowaniu nowo utworzonego modelu do któregoś z modeli w katalogu.

Marr’skie podejście było pionierskie, bo próbowało połączyć neurofizjologię, psychologię i informatykę. Opisywało widzenie tak, jakby mózg wykonywał obliczenia na obrazie. W praktyce elementy tej teorii znalazły potwierdzenie. Wiemy, że już w siatkówce i pierwszorzędowej korze wzrokowej następuje detekcja prostych cech (krawędzi – odkrycia Hubela i Wiesela), a dalsze obszary mózgu integrują te informacje w coraz bardziej złożone reprezentacje. Nie jest to jednak proces czysto sekwencyjny. Współczesne badania wskazują, że wyższe poziomy mogą wpływać zwrotnie na niższe (wpływy odgórne). Niemniej Marr dał podwaliny pod myślenie o widzeniu jako o kilku etapach ekstrakcji informacji o kształcie i strukturze obiektów.

Teoria geonów Biedermana

Inny wpływowy model zaproponował w 1987 r. Irving Biederman. Jego teoria rozpoznawania poprzez komponenty (RBC – Recognition-By-Components) zakłada, że do identyfikacji obiektu wykorzystujemy podstawowe trójwymiarowe formy zwane geonami (od “geometric ions”, geometryczne jony). Według Biedermana istnieje zestaw kilkudziesięciu prostych brył (ok. 36 geonów) – prostopadłościany, stożki, cylindry, kliny, wycinki itp., z których składać się mogą złożone obiekty. To analogia do liter i słów Tak jak z ograniczonego alfabetu liter można zbudować tysiące wyrazów, tak z ograniczonego “alfabetu””” geonów można skonstruować niezliczone kształty obiektów.

Proces rozpoznawania wg Biedermana przebiega następująco: najpierw nasz system wzrokowy segmentuje obraz obiektu na części. Dzieje się to w miejscach tzw. głębokiej wklęsłości konturu. Tam gdzie obrys obiektu wyraźnie się zagina do wewnątrz, mózg “tnie” figurę na kawałki. Każda taka część odpowiada jednemu geonowi albo kombinacji geonów. Następnie na podstawie cech krawędzi (np. zakrzywienie, równoległość, symetria, zbieżność linii) system identyfikuje, jaki to geon. Co istotne, Biederman wybrał geony tak, by można je rozpoznać z różnych perspektyw i przy pewnym zniekształceniu. Cechy krawędzi, które definiują dany geon, są dość niezależne od kąta patrzenia czy jakości obrazu. Na przykład cylinder zawsze będzie miał dwie równoległe linie proste (jego boki) połączone dwoma zakrzywionymi (góra i dół) i to rozpoznamy, nawet jeśli cylinder jest częściowo zasłonięty czy przedstawiony jako szkic.

Kiedy już wyodrębnimy i rozpoznamy geony obiektu oraz ich układ przestrzenny (np. duży pionowy blok na dole, na nim mniejszy poziomy, do tego cylinder z boku), to porównujemy ten układ geonów z zapisanymi w pamięci wzorcami obiektów. Jeśli zgodność jest wystarczająca, obiekt zostaje rozpoznany jako ten wzorzec. Biederman argumentował, że taka reprezentacja jest odporna na różne utrudnienia. Nawet gdy widzimy obiekt pierwszy raz z nowej perspektywy lub niekompletny, wystarczy że dwa-trzy geony da się zidentyfikować, a rozpoznanie będzie możliwe. Nazywał to zasadą komponentalnej odbudowy Jeżeli z obrazu da się “odbudować” (wywnioskować) układ geonów, to rozpoznanie nastąpi szybko i poprawnie. Dlatego potrafimy rozpoznać np. krzesło nawet na szkicu czy cieniu, o ile widać charakterystyczne elementy (siedzisko, oparcie, nogi, dające się przybliżyć geonami).

Teoria geonów dobrze wyjaśnia m.in. odporność rozpoznawania na częściowe zasłonięcie – jeśli kot siedzi za płotem, widać go we fragmentach, lecz dopóki można wydobyć parę geonów (ogon, łukowaty grzbiet), i tak wiemy, że to kot. Poparta jest też eksperymentami: ludzie lepiej rozpoznają obiekt, z którego usunięto procentowo spory fragment, ale tak, że pozostałe części zachowują kluczowe geony, niż obiekt, któremu niby brakuje mniejszego fragmentu, ale „ucięło” to krytyczne cechy geonów. Nasz system percepcyjny jest więc wrażliwy nie tyle na szczegóły, co na obecność/nieobecność fundamentalnych komponentów.

Oczywiście teoria RBC nie tłumaczy wszystkiego, np. rozpoznawania twarzy, gdzie każdy człowiek ma te same geony (dwie gałki, nos jak klin, usta jak szczelina), a jednak odróżniamy setki znajomych twarzy po subtelnych różnicach. Pojawiły się też alternatywne podejścia, sugerujące że rozpoznajemy obiekty raczej przez porównywanie obrazów z różnych ujęć (teorie wzorców widokowych) niż przez składanie z geonów. Niemniej RBC jest ważnym kamieniem milowym. Podkreśliła rolę segmentacji obiektu na części i relacji przestrzennych tych części. Do dziś w wizji komputerowej używa się pomysłów z geonów przy projektowaniu systemów rozpoznawania kształtów.

percepcja

Mózg patrzy i słucha – sygnatury neuronalne percepcji

Śledząc drogę od bodźców do rozpoznania, warto zajrzeć do wnętrza mózgu. Co dzieje się z sygnałami wzrokowymi i słuchowymi, kiedy już dotrą do centralnego układu nerwowego? Dziedzina neuronauki percepcji dostarczyła nam w ostatnich dekadach fascynujących odkryć dzięki nowoczesnym metodom obrazowania i pomiaru aktywności, takim jak EEG, MEG, fMRI czy ODT. Pozwalają one zajrzeć w czas i przestrzeń aktywności mózgu podczas spostrzegania.

Błysk w 170 milisekund – elektryczne echa rozpoznania

Za pomocą EEG (elektroencefalografii) rejestrujemy bioelektryczne sygnały z mózgu. W eksperymentach percepcyjnych często bada się tzw. wywołane potencjały – charakterystyczne fale EEG pojawiające się w odpowiedzi na określony bodziec. Jedną z najbardziej znanych jest fala N170, czyli negatywna fala około 170 ms po bodźcu, szczególnie wyraźna nad tylną częścią mózgu (płaty potyliczno-skroniowe). N170 okazała się “podpisem elektrycznym” percepcji twarzy. Gdy prezentujemy twarz, amplituda N170 jest duża; dla innych obiektów (np. domów, samochodów) – znacznie mniejsza. Co więcej, odwrócenie twarzy do góry nogami (co utrudnia jej rozpoznanie) powoduje opóźnienie i zwiększenie N170. Mózg “męczy się” przy przetwarzaniu nietypowo prezentowanej twarzy. Ten efekt nie występuje tak silnie dla innych obiektów. Sugeruje to, że mózg posiada szybki, wyspecjalizowany mechanizm detekcji twarzy, aktywujący się ~0,17 sekundy od zadziałania bodźca.

Podobnie zidentyfikowano inne komponenty ERP, świadczące np. o kategoryzacji bodźców (P300 – dodatnia fala około 300 ms, kojarzona z rozpoznaniem czegoś istotnego lub nieoczekiwanego), czy o błędach przewidywań (PE – potencjał błędu). EEG ma doskonałą rozdzielczość czasową, więc pokazuje, jak szybko następują kolejne etapy. W ciągu pierwszych 100 ms kora wzrokowa koduje podstawowe cechy (P1, N1), do 170 ms pojawia się rozpoznanie twarzy (N170), potem od ~250 ms wchodzą w grę procesy uwagowe i pamięciowe. To niesamowite. W niecałe 1/5 sekundy mózg potrafi stwierdzić “to twarz“, a w kolejnych setnych częściach sekundy wie już, czy znajoma, jaką ma emocję itp.

Obrazy mózgu – dokąd patrzysz, gdy widzisz?

Metody obrazowania, jak fMRI (funkcjonalny rezonans magnetyczny) czy PET, umożliwiły zlokalizowanie w mózgu obszarów odpowiedzialnych za różne aspekty percepcji. Kiedy oglądamy określone bodźce, pewne rejony stają się bardziej aktywne metabolicznie – “świecą” na skanach. Kluczowym odkryciem było zidentyfikowanie specjalistycznych obszarów kory wzrokowej dla różnych kategorii bodźców.

Najgłośniejszym przykładem jest zakręt wrzecionowaty na spodniej (brzusznej) części płatów skroniowych. W 1997 r. zespół Nancy Kanwisher doniósł o znalezieniu tam obszaru, który uaktywnia się dużo silniej na widok twarzy niż jakichkolwiek innych obiektów. Nazwano go fusiform face area (FFA), czyli wrzecionowate pole twarzowe. W eksperymentach fMRI u niemal wszystkich badanych w prawym (często i lewym) zakręcie wrzecionowatym występował wyraźny przyrost sygnału, gdy oglądali zdjęcia twarzy, w porównaniu np. ze zdjęciami przedmiotów, miejsc czy zwierząt. Dodatkowe testy potwierdziły, że nie jest to efekt większej uwagi czy trudności – FFA reaguje selektywnie na twarze jako kategorię. Odkrycie to wsparło hipotezę, że mózg ma specjalny moduł do przetwarzania twarzy, wykształcony ewolucyjnie ze względu na ogromne znaczenie twarzy w życiu społecznym.

Analogicznie znaleziono inne “zakładki”: np. PPA (parahippocampal place area) aktywną przy oglądaniu scen i krajobrazów (miejsc), EBA (extrastriate body area) reagującą na sylwetki ludzkie (ciała), czy VWFA (visual word form area) – obszar w lewej dolnej korze skroniowej odpowiadający za rozpoznawanie słów (pisma). Wszystko to w tzw. strumieniu brzusznym przetwarzania wzrokowego (ścieżka wzdłuż dolnej części mózgu, od płata potylicznego ku skroniowemu), który zajmuje się głównie identyfikacją “co” widzimy. Z kolei strumień grzbietowy (“gdzie/jak”) w górnej części mózgu obsługuje percepcję przestrzeni i ruchu. Tam znajdują się obszary analizujące np. ruch (pole MT/V5) czy koordynujące widzenie z ruchem dłoni.

Badania aktywności mózgu uwidoczniły też zjawiska takie jak stałość percepcyjna na poziomie neuronalnym. Przykładowo, obiekt oglądany pod różnymi kątami aktywuje nieco inne neurony w pierwotnej korze wzrokowej (bo obraz na siatkówce się zmienia), ale w wyższych rejonach skroniowych często te same neurony reagują na obiekt niezależnie od widoku. Czyli pewne neurony rozpoznawcze kodują raczej tożsamość obiektu niż jego obraz – w literaturze obrazowo nazywa się je czasem “neurony babcine” (żartobliwie: neuron, który “odpala się” na widok twojej babci, bez względu na jej ubiór, pozę itp.). Co prawda koncepcja tak skrajnie wyspecjalizowanych komórek jest dyskusyjna, ale faktem jest istnienie w korze skroniowej neuronów reagujących wysoce selektywnie, np. tylko na twarze małp, albo tylko na określony kształt lub kategorię.

Neuronalne sygnatury percepcji objawiają się również w synchronizacji populacji neuronów (np. oscylacje gamma powiązano z koherentnym spostrzeganiem cech obiektu) oraz we wzorcach aktywności wykrywanych metodami uczenia maszynowego w skanach fMRI (tzw. dekodowanie – na podstawie map aktywności można czasem odgadnąć, co osoba widzi). Powoli więc rozszyfrowujemy “język””” mózgu używany do reprezentowania percepcji.

Twarze to wyjątkowy przypadek percepcji

Rozpoznawanie twarzy zasługuje na osobny akapit, bo jest to supermoc naszego mózgu. Dla większości z nas twarze są najważniejszymi bodźcami wizualnymi – rozpoznajemy setki osób, odczytujemy z twarzy emocje, intencje. Już niemowlęta wykazują preferencję do patrzenia na twarze (wolą wzór przypominający oczy-nos-usta niż inne układy kształtów). Ewolucyjnie ma to sens. Przetrwanie w społeczności zależało od rozpoznawania swoich i rozumienia ich przekazów.

Nie dziwi zatem, że twarze angażują wyspecjalizowany system neuronalny. Wspomnieliśmy o FFA – polu twarzowym. Ale to nie jedyny element układanki. Zlokalizowano tzw. obszar twarzowy w zakręcie wrzecionowatym (FFA)obszar twarzowy w zakręcie potylicznym (OFA) oraz region w górnej skroniowej bruździe (pSTS) – razem tworzą “rdzeń” systemu twarzowego, przetwarzający strukturalne cechy twarzy i ruchy mimiczne. Do tego dochodzą inne obszary integrujące informacje o tożsamości, imieniu, głosie itd.

Jak wyjątkowe są twarze, pokazują przypadki kliniczne i badania wybitnych naukowców. Hadyn D. Ellis, jeden z pionierów badań nad rozpoznawaniem twarzy, już w latach 70. wskazywał, że twarze mogą być przetwarzane inaczej niż inne bodźce. W klasycznym badaniu wykazał np., że przy rozpoznawaniu znajomych twarzy kluczowe są ich wewnętrzne cechy (oczy, nos, usta), podczas gdy przy twarzach obcych bardziej polegamy na zarysie głowy czy fryzurze. Innymi słowy, trening z konkretnymi twarzami uczy nas zwracać uwagę na subtelności rysów, a nie tylko ogólny kształt. Zjawisko to – holistyczne przetwarzanie twarzy – polega na tym, że twarz spostrzegamy jako nierozdzielną całość, a nie sumę części. Dowodem jest efekt Thatcher: zdjęcie twarzy z odwróconymi do góry nogami oczami i ustami wydaje się prawie normalne, dopóki patrzymy na nie do góry nogami. Dopiero w normalnej orientacji widzimy, jak potwornie jest zniekształcone. To pokazuje, że przetwarzanie twarzy odwróconej jest utrudnione, bo tracimy nasz holistyczny schemat.

Martha Farah, kolejna wybitna badaczka, zajmowała się m.in. przypadkami zaburzeń rozpoznawania twarzy, czyli prozopagnozji. Prozopagnozja to stan, w którym osoba widzi twarz (np. wie, że to twarz mężczyzny z brodą), ale nie potrafi rozpoznać, czyja to twarz, nawet najbliższych osób. Farah i inni opisali zarówno prozopagnozję nabytą (po uszkodzeniach mózgu, np. udarze) jak i wrodzoną (niektóre osoby rodzą się z tą przypadłością). W głośnym artykule Farah i współpracownicy przedstawili chłopca, który doznał uszkodzenia mózgu dzień po narodzinach i później przejawiał typową prozopagnozję, mocno upośledzone rozpoznawanie twarzy przy relatywnie zachowanym rozpoznawaniu obiektów. Interpretują to jako dowód, że specjalizacja mózgu do twarzy jest wrodzona – genetycznie zaprogramowana. Mózg, mimo że tak wcześnie uszkodzony, nie “przeorganizował się” by twarze rozpoznawać innymi strukturami; raczej “zabrakło mu” tych specjalnych mechanizmów od początku. Farah wskazuje też, że prozopagnozja często idzie w parze z zachowaniem zdolności rozpoznawania przedmiotów (i odwrotnie – zdarzają się agnozje obiektów przy zachowanym rozpoznawaniu twarzy). To sugeruje, że twarze są czymś wyjątkowym dla mózgu, być może angażują unikalny tryb przetwarzania (holistyczny), podczas gdy większość obiektów rozpoznajemy raczej poprzez części (cechy).

Hadyn Ellis z kolei badał ciekawe powiązanie percepcji twarzy z reakcjami emocjonalnymi na nie. W zespole Capgrasa (rzadkim zaburzeniu psychiatrycznym) pacjenci są przekonani, że bliska im osoba została zastąpiona przez sobowtóra. Ellis i współpracownicy wykazali, że osoby z urojeniem Capgrasa rozpoznają twarze poprawnie w sensie percepcyjnym, ale brakuje u nich normalnej reakcji emocjonalnej na widok znajomej twarzy. W testach mierzących reakcje skórno-galwaniczne (potliwość – oznaka pobudzenia emocjonalnego) pacjenci Ci nie różnili sygnału dla twarzy bliskich i obcych, podczas gdy zdrowi wykazują silniejsze pobudzenie na widok bliskich. To doprowadziło do hipotezy, że rozpoznanie twarzy bliskiej osoby ma dwa komponenty. Poznawczy (wiem, że to mama) i emocjonalny (czuję, że to mama). Urojeniem “osoba to impostor” może powstać, gdy drugi komponent nie zadziała – twarz jest niby podobna, ale “nie czuję tego”, więc chory wymyśla wyjaśnienie, że to sobowtór. To pokazuje, jak skomplikowanym fenomenem jest percepcja twarzy. Wiąże się nie tylko z czystym widzeniem kształtów, ale i z pamięcią oraz emocjami.

Na koniec warto podkreślić. Choć mamy w mózgu wyspecjalizowane struktury do twarzy, to w codziennym życiu wykorzystujemy całą sieć procesów. Rozpoznanie znajomej twarzy aktywuje zarówno FFA, jak i obszary pamięci (przypominamy sobie, skąd ją znamy), obszary językowe (przypomnienie imienia) czy emocjonalne (reakcja na osobę). Mózg działa całościowo niczym orkiestra, gdzie sekcja „twarzowa” gra pierwsze skrzypce przy tym szczególnym rodzaju bodźca.

Stałość percepcji – plastyczny mózg wobec zmiennego świata

Gdy poruszamy się, zmienia się kąt patrzenia na przedmioty; o zmierzchu kolory bledną; ludzi widujemy z różnych stron, a jednak postrzegamy obiekty jako stałe. Drzwi nadal są prostokątne choć widziane pod skosem, kartka w cieniu jest biała choć pada na nią mniej światła. To dzięki mechanizmom stałości percepcyjnej, zdolności mózgu do korygowania wpływu warunków obserwacji. Wspomnieliśmy już o stałości wielkości. Dzięki niej osoba oddalająca się nie kurczy się dla nas; stałości kształtu: talerz widziany pod kątem nadal “jest okrągły” choć obraz na siatkówce to elipsa; stałości jasności i barwy: biały śnieg o zachodzie słońca (gdzie światło jest czerwonawe) nadal wydaje się biały, nie różowy.

Stałość percepcji jest efektem nieuświadomionych poprawek, jakie nasz mózg wprowadza na podstawie kontekstu. Wykorzystuje np. informację o oświetleniu – zna “kolor światła” i potrafi wywnioskować właściwy kolor obiektu (to tzw. adaptacja barwna; słynny spór o kolor sukienki – biało-złota czy niebiesko-czarna, wynikał z odmiennej interpretacji oświetlenia na zdjęciu przez ludzi). Przy stałości kształtu mózg uwzględnia perspektywę, jeśli coś wygląda mniejsze i zniekształcone, ale otoczenie sugeruje określony kąt widzenia, to “odkształca” w umyśle obraz by odzyskać prawdziwy kształt.

owoce edited

Zwykle te mechanizmy pomagają nam w prawidłowym spostrzeganiu świata pomimo zmiennych warunków. Jednak bywają źródłem złudzeń, gdy zostaną zastosowane niewłaściwie. Wspomniana iluzja Müller-Lyera jest tu klasycznym przykładem. Nasz mózg stara się wykonać stałość wielkości. Linia wyglądająca jak krawędź oddalającego się narożnika pokoju (finy strzałek do wewnątrz) wydaje się być dalej niż identycznej długości linia wyglądająca jak wystający narożnik (finy na zewnątrz). Skoro jedna linia wydaje się “dalej”, a obie rzutują ten sam rozmiar, to mózg nadinterpretuje dalszą jako dłuższą, i oto jedna wydaje się dłuższa od drugiej. Podobne “gafy” mózg popełnia przy iluzji księżyca (księżyc nisko nad horyzontem wydaje się ogromny, bo w interpretacji mamy odniesienie do obiektów w dali, np. budynków, i mózg chyba sądzi, że musi być wielki, skoro tak wyraźnie go widać za tymi budynkami), czy iluzjach barwnych (szachownica Adelsona, gdzie pole w cieniu i pole w świetle, fizycznie różnej jasności, widzimy jako jednakowe, bo mózg kompensuje cień).

Stałość percepcji pokazuje generalną zasadę: mózg nie dąży do wiernego odtworzenia bodźca, tylko do wydobycia istotnych właściwości obiektów. Interesuje go “co to jest” i “jaki to ma być obiekt”, a nie surowe dane. Dlatego poprawia nasze postrzeżenia, by zgadzały się z wiedzą o świecie (drzwi są prostokątne). Znakomicie ujął to Helmholtz mówiąc o percepcji jako wnioskowaniu nieświadomym. Nasze zmysły to tylko punkt wyjścia, a dalej mózg zgaduje (na podstawie doświadczenia) co naprawdę jest przedmiotem bodźców. Zwykle zgaduje trafnie… ale czasem daje się zwieść.

Zmysły oszukane – złudzenia i nastawienia

Złudzenia percepcyjne to efekt, który fascynuje zarówno naukowców, jak i artystów. W gruncie rzeczy, każde złudzenie odsłania reguły działania naszego systemu percepcyjnego – pokazuje, jakich heurystyk używa mózg i gdzie leży granica ich niezawodności. Omówiliśmy już kilka złudzeń geometrycznych. Warto wspomnieć też o złudzeniach figura-tło i dwuznacznych obrazach, bo one pokazują aktywny charakter interpretacji.

Na pewno każdy widział słynny obraz Rubin’s vase – czarno-biały rysunek dwóch profilów twarzy, które jednocześnie tworzą kształt wazy.

Rubin's vase

Nasza percepcja przełącza się między dwiema interpretacjami. Albo widzimy białą wazę na szarym tle, albo dwa czarne profile na białym tle. Nie da się widzieć obu naraz. Mózg musi zadecydować, co jest figurą, a co tłem. To zilustrowanie tzw. selekcji percepcyjnej. Nawet mając ten sam bodziec na siatkówce, umysł może różnie go zorganizować. Złudzenia dwuznaczne (np. stara lub młoda kobieta – rysunek, w którym profil staruszki jednocześnie jest sylwetką młodej kobiety odwróconej) również pokazują, że interpretacja to nie bierny proces, percepcja potrafi mieć dwa oblicza, bo mózg potrafi dopasować dwa różne znaczenia do tych samych danych. Czasem drobny kontekst lub nastawienie zadecyduje, co zobaczymy najpierw.

Złudzenia potwierdzają też istnienie przetwarzania odgórnego. Weźmy paradoks słuchowy. W nagraniu odtwarzanym od tyłu ludzie słyszą “tajemnicze przesłanie” dopiero, gdy im się powie, czego szukać. Wtedy nagle to “słyszą”, choć fizycznie nic się nie zmieniło w dźwięku. Ich oczekiwanie narzuca interpretację hałasowi. Wzrokowo podobnie – zjawisko pareidolii to widzenie sensownych kształtów tam, gdzie ich brak (np. twarzy w chmurach czy na wypalonej grzance). Mózg ma tak silne nastawienie na wykrywanie znajomych form, że przy odrobinie podobieństwa natychmiast “nadinterpretuje”.

Wiele iluzji ma też związek z uwagą – na co kierujemy uwagę, to staje się figurą, reszta idzie w tło. Iluzje magików często polegają na sprytnym przekierowaniu naszej uwagi (kierujemy się tam, gdzie spodziewamy się czegoś zobaczyć). Klasyczne zjawisko ślepoty na zmianę (change blindness) nie jest wprost złudzeniem geometrycznym, ale pokazuje, że możemy nie zauważyć nawet dużych zmian w obrazie, jeśli nastąpią w momencie mrugnięcia lub odwrócenia wzroku. Mózg “szyje” nasze spostrzeżenie ze spojrzeń i zakłada pewną ciągłość – i może nie odnotować, że w międzyczasie np. w pokoju zniknęło krzesło. Percepcja nie jest bowiem fotograficznym zapisem, a raczej rekonstrukcją – a rekonstrukcja nie rejestruje wszystkiego, tylko to, co istotne.

Podatność na iluzje jest więc ceną za inteligentne skróty myślowe percepcji. Zazwyczaj zyskujemy na nich sprawność i adekwatność spostrzegania, lecz czasem dają się podejść w szczególnych konfiguracjach bodźców. Iluzje działają u wszystkich tak samo, bo mamy wspólne, wrodzone mechanizmy przetwarzania (np. interpretację perspektywy). Ciekawostką jest, że czynniki kulturowe mogą minimalnie modulować złudzenia, np. ludzie z kultur mniej “przepełnionych” kątami prostymi i architekturą nieco słabiej ulegają iluzji Müller-Lyera (bo ich mózg rzadziej widuje układ podobny do narożników pokoju, więc inaczej kalibruje wyciąganie wniosków). Jednak zasadniczo wszyscy jesteśmy iluzyjni w podobny sposób. To wiele mówi o uniwersalności naszego systemu wzrokowego.

Pozbawieni bodźców – co robi mózg w ciszy i ciemności?

Na koniec rozważmy skrajny przypadek – deprywacja sensoryczna, czyli brak bodźców. Co się dzieje, gdy mózg nie dostaje żadnych danych ze zmysłów? Intuicyjnie można by sądzić, że w takim wypadku nastanie “cisza i ciemność” w umyśle. Rzeczywistość okazuje się zupełnie inna i wręcz paradoksalna.

Klasyczne eksperymenty z lat 50. (McGill University) polegały na umieszczaniu ochotników na wiele godzin w warunkach minimalnej stymulacji. Leżeli w wygodnej pozycji w przyciszonym pomieszczeniu, z ograniczonym dotykiem (np. ręce w pudełkach), często w półmroku lub z zasłoniętymi oczami, i słuchawkami szumiącymi jednolitym dźwiękiem. Okazało się, że po pewnym czasie ludzie zaczynali doświadczać halucynacji wzrokowych i słuchowych. Mózg niejako sam generował wrażenia, próbując “wypełnić pustkę”. Zgłaszali np. błyski światła, wzory geometryczne, a nawet słyszeli głosy czy muzykę. Co więcej, przedłużona deprywacja (kilkadziesiąt godzin) powodowała duży dyskomfort psychiczny – lęk, dezorientację, trudności myślenia. Mózg źle znosi brak stymulacji. Zaczyna niejako “kręcić filmy sam dla siebie” (halucynacje), a jednocześnie zaburza się normalny przebieg myśli i emocji.

Współcześnie kontrolowana deprywacja bywa stosowana terapeutycznie w formie floatingu (leżenia w izolującej kapsule w wodzie z solą w temperaturze ciała). Krótkie sesje (godzinne) dają efekt głębokiego relaksu. To raczej ograniczenie bodźców niż całkowite ich wycięcie. Natomiast przymusowa deprywacja (stosowana nieetycznie np. w więzieniach jako izolacja w ciemnej celi) potrafi wywołać silne objawy – od halucynacji, przez depresję, po utratę poczucia czasu.

To zjawisko ma też drugą stronę medalu. Normalny rozwój zmysłów wymaga stymulacji. Badania na zwierzętach pokazały dramatyczne efekty deprywacji we wczesnym okresie życia. Klasyczny eksperyment: kocięta wychowywane w pomieszczeniu, gdzie były tylko pionowe czarno-białe pasy, nie nauczyły się widzieć linii poziomych. Ich neurony w korze wzrokowej nie rozwinęły wrażliwości na orientację poziomą. Kiedy później trafiły do normalnego środowiska, wpadały na poprzeczki, bo dosłownie ich nie widziały. Mózg w rozwoju musi “nastroić” swoje obwody na typowe bodźce, jeśli ich zabraknie, nie zbuduje odpowiednich detektorów. U ludzi drastyczna deprywacja wzrokowa od urodzenia (np. z powodu uszkodzonej rogówki) skutkuje nieodwracalną ślepotą neuronalną, jeśli nie zostanie wcześnie przywrócone widzenie. Mózg przestawia te obszary na inne funkcje.

Percepcja nie jest więc dana raz na zawsze. Wymaga trenowania przez doświadczenie. Zmysły i mózg tworzą dynamiczny system, bez bodźców mózg traci punkt odniesienia, a w okresie krytycznym – możliwość normalnej kalibracji. Z jednej strony mamy więc niesamowitą plastyczność (mózg dostosowuje się do środowiska), z drugiej – wrażliwość na brak stymulacji.

Umysłowe odzwierciedlenie świata

Nasza podróż przez zagadnienia percepcji ukazuje jedno. To, co odbieramy zmysłami, jest konstrukcją naszego mózgu. Nie oznacza to bynajmniej, że żyjemy w iluzji oderwanej od rzeczywistości, raczej, że mózg dokonuje najlepszej możliwej interpretacji danych, jakie otrzymuje. Na ogół interpretacja ta jest bardzo trafna i użyteczna. Widzimy obiekty stabilnie, rozpoznajemy je szybko, dostrzegamy ważne sygnały (np. twarz groźnego człowieka w tłumie) niemal natychmiast. Percepcja przypomina pracę detektywa – z fragmentów poszlak rekonstruuje pełen obraz zdarzeń. Czasem detektyw da się zwieść, stąd złudzenia czy błędy spostrzeżeń, ale w ogromnej większości przypadków jego hipotezy są słuszne.

Za kulisami naszych doznań zmysłowych pracuje imponujący aparat neuronalny. Wyspecjalizowane obwody wzrokowe i słuchowe, współdziałające z pamięcią i emocjami. Obraz, który oglądamy, aktywuje kaskady sygnałów, od siatkówki przez kolejne warstwy kory, gdzie pojawią się krawędzie, potem kształty, potem obiekty i ich znaczenie. To, co świadomie widzimy, jest więc już wynikiem wielostopniowej analizy. Dlatego właśnie różni ludzie mogą nieco różnie postrzegać tę samą scenę, bo ich mózgi mogą inaczej ustawić akcenty, mają różne doświadczenia.

Na koniec, pamiętajmy paradoks. To, że percepcja nas oszukuje w iluzyjnych sztuczkach, jest dowodem jej siły na co dzień. Gdyby mózg nie stosował sprytnych założeń (np. że światło pada z góry, że rzeczy są w miarę stałe), to by tych iluzji nie było, ale wtedy nasza codzienna percepcja byłaby zawodna i powolna. Iluzje to “wypadki przy pracy” świetnie naoliwionej machiny percepcji. W większości sytuacji to, co widzimy i słyszymy, jest najbliższą możliwą rzeczą rzeczywistości, a czasem nawet lepszą, bo uzupełnioną o znaczenie i kontekst.

Ostatecznie, ludzki proces percepcji to cudowna synteza fizjologii i psychologii. Oczy i uszy dostarczają informacji, a mózg tworzy z nich bogaty obraz świata, w którym żyjemy. Następnym razem, gdy zachwycisz się zachodem słońca lub rozpoznasz przyjaciela z daleka po sylwetce, pomyśl o tej niesamowitej maszynerii neuronalnej, dzięki której zwykłe bodźce zamieniają się w świadome doświadczenie.

Artykuły eksperckie

  • Efekt reflektora w biznesie: dlaczego nie jesteś w centrum uwagi

    Wyobraź sobie, że prowadzisz ważne spotkanie zespołu i podczas prezentacji mylisz jeden slajd lub zapominasz wypowiedzieć przygotowaną puentę. Serce bije ci mocniej. Myślisz sobie, że wszyscy musieli to zauważyć! Po spotkaniu dręczysz się myślą, że współpracownicy analizują twoją wpadkę i kwestionują…

    efekt reflektora
  • Recenzja książki „Zrozumieć emocje. Kurs pozytywnej zmiany” Aleksandry Borowskiej

    Kiedy w mojej skrzynce pojawiła się przesyłka od Aleksandry Borowskiej, poczułam się naprawdę wyróżniona. Emocje są dla mnie tematem wyjątkowym - od lat łączę ich zrozumienie z pracą zawodową, strategią marketingową i neuromarketingiem, ale też z własnym rozwojem i poszukiwaniem…

    Zrozumieć emocje
  • Władza a mózg: im wyżej na stołku, tym trudniej zrozumieć

    Władza to nie tylko prestiż i przywileje. Liczne badania psychologiczne pokazują, że samo sprawowanie władzy zmienia sposób myślenia i odczuwania. Osoby na wysokich stanowiskach częściej koncentrują się na własnych celach, szybciej podejmują decyzje i bywają mniej wrażliwe na sygnały płynące…

    władza
  • Pamięć i jej zmienność: Prace Elisabeth Loftus i współczesna nauka

    Pamięć odgrywa kluczową rolę w naszym życiu. Pozwala nam uczyć się, planować i budować tożsamość. Na co dzień traktujemy nasze wspomnienia jako wierny zapis przeszłych zdarzeń. Wydaje nam się, że są one trwałe i dokładne, zwłaszcza gdy towarzyszą im silne…

    pamięć
  • Efekt ponadprzeciętności w biznesie: Jak nadmierna pewność siebie wpływa na

    Efekt ponadprzeciętności stanowi jedno z najbardziej powszechnych i jednocześnie najbardziej szkodliwych zjawisk kognitywnych w środowisku biznesowym. To systematyczna tendencja do oceniania własnych umiejętności, cech osobowości i osiągnięć jako lepszych od przeciętnej. Zjawisko to, znane również jako better-than-average effect (BTAE), zostało po raz pierwszy…

    efekt ponadprzeciętności
  • Sprawdź swój koszyk
    0
    Dodaj kod kuponu
    Suma