Régóta hallhatjuk ezt a szinte nagyzolónak hangzó kifejezést, "kiterjesztett elme". De vajon tudjuk-e, hogy mit kellene ezalatt értenünk?
Biztosan sokan vannak, akik pontosan tudják, elsősorban nem is nekik szól ez a bejegyzés, bár talán őket is meg tudjuk örvendeztetni pár színes példával, amennyiben még nem olvasták Andy Clark: Supersizing the Mind című könyvét. Inkább azoknak szántuk ezt a bejegyzést, akik bele-belebotlottak már ebbe a tudományosan csengő kifejezésbe, és azt gondolva, hogy ez biztosan valami számukra megközelíthetetlen, majdhogynem isteni tulajdonságokkal felruházott fogalom, vagy azt feltételezve, hogy ez is biztos egy újabb sci-fi szagú őrültség, inkább tisztes távolságban maradtak tőle. Az igazság azonban az, hogy nincs benne semmi isteni eredetű és semmi sci-fi sem. Pontosabban a titokzatos burok lehámozható és ami marad, az egy izgalmas, filozófiai, kognitív tudományi, illetve biológiai szempontból is elgondolkodtató elméleti keret.
Mi az elme, mi tartozik bele? Az agy, ami egy be- és kimenetekkel rendelkező komputációs egység? Esetleg részét képezi a testünk is, hiszen ez az a felület, amely közvetlenül érintkezik a környezettel, ami hatással van rá, ezzel együtt viszont maga a környezet is változik általunk? Mi a helyzet a használati eszközeinkkel? Elképzelhető, hogy egy mobiltelefon az elménk részét képezi? Lehetséges, hogy saját evolúciónkat mi is befolyásoljuk azzal, hogy milyen környezetet építünk magunk köré?
Ezekre a kérdésekre kísérel meg választ adni Andy Clark könyve és ezeket a válaszokat igyekszünk most mi is összefoglalni röviden, néhány további gondolatot is beleszőve.
A kiterjesztett elme kapcsán nekem elsőre valami, a terminátorhoz hasonló robot, de mindenesetre valami feltétlenül mesterséges intelligencia jut az eszembe. Pontosabban jutott eszembe mindaddig, amíg a kezembe nem került a Supersizing the Mind. Mert mi is az, amit elsőre magunk elé képzelünk, ha az elme kiterjesztéséről beszélünk? Egy szuperintelligens, az embernél sokkal gyorsabb robot, ami/(aki?) nagyobb memóriával, hatékonyabb előhívási stratégiákkal rendelkezik, esetleg repülni is tud, hihetetlenül erős, legalább annyira mint Hulk, csak nem annyira ideges és legalább plusz két modalitással rendelkezik az emberhez képest (mondjuk látja az ultraviolát meg minimum 4D-s tereket érzékel).
Akkor ez a könyv cyborgokról szól tulajdonképpen? Nem, épp ez az izgalmas benne. Nem cyborgokról, hanem rólunk szól. Az, hogy nem fikció az egész, adja a téma és így a könyv vonzerejét is. Valós kutatásokon és kutatási eredményeken keresztül mutatja meg, hogy milyen hihetetlen plaszticitással rendelkezik az agyunk és hogy mennyire szerves részét képezi a neurális hálózatnak a szélesebb mind-body-environment, vagyis az elme, a test és a környezet hármasa.
ASIMO egy emberéhez hasonló mozgásra képes robot, ami önmagában lenyűgöző mérnöki eredmény. Mégis, egy igazán jelentős különbség ember és ASIMO mozgása között, hogy ASIMO minden kis rezdüléséhez aktív energiabefektetésre van szükség, míg az emberi mozgás esetében jelentős mértékben ki van használva a test strukturális adottsága. Vagyis a test súlypontja, a lendület, a tehetetlenség mind mind ki vannak használva és így ASIMO robot energiafelhasználásához képest az embernek annak csak töredékére van szüksége ugyanazon mozdulatsor kivitelezéséhez.
Tehát ASIMO esetében a mozgás egy folyamatos, aktív, energiafelhasználó folyamat, ASIMO-nak meg kell terveznie a lépést, a lépés után a testsúly áthelyezését, a másik láb lendülését, a földön való továbbgördülést és így tovább. Az embernél ezzel szemben ezeknek a mozgásoknak a jelentős része passzív, ami annyit jelent, hogy míg az egyik mozdulat aktív energiabefektetést igényel, ez az energia más, passzív mozgásokban tovább hasznosul. Ezek viszont már nem igényelnek további energiabefektetést, hiszen az előző mozdulat lendületének vagy éppen egy megfeszített izomcsoport ellazításának köszönhetően következnek be. Így a test tulajdonképpen nem csak egy eszköz, amivel az agy kivitelezi a megtervezett mozgást, hanem egyben aktív részese is a mozgatás folyamatának. Ezáltal tulajdonképpen az aggyal együttműködő “partnerként” is tekinthetünk rá, hiszen léteznek olyan passzív-dinamikai folyamatok, melyeket nem az agy tervez meg és számít ki nagyon pontosan, hanem amelyek csupán a test morfológiájából következnek.
Hogyan képezzük le a környezetünket, mit tesz az agyunk? Az a helyzet, hogy egy gazdag belső reprezentációt készítünk arról, amit érzékelünk vagy egészen máshogyan zajlik ez a folyamat?
A könyv több példát is hoz, amelyek inkább az utóbbi nézőpontot támogatják.
Az első ilyen az úgynevezett block-copying feladat. Ez arról szól, hogy van egy különböző színű téglalapokból felépített alakzatunk, amit le kell másolnunk úgy, hogy van egy forrásunk, ahonnan kiválogathatjuk az éppen megfelelő színű téglalapot, illetve van egy építő terünk, ahol felépíthetjük a lemásolt alakzatot. Ha megkérném az olvasókat, hogy képzeljék el a feladat-végrehajtás folyamatábráját, valószínűleg azt (az egyébként teljesen logikus) megoldást kapnám a legtöbb esetben, hogy ránézünk a lemásolni való blokkra, kiválasztunk egy téglalapot, aztán átnézünk a forrásba, kiválasztjuk a megfelelő színű darabot és elhelyezzük az építő térben a megfelelő helyre. Erre gondoltak? Na ugye.
Azonban ez a folyamat kísérletesen megvizsgálva nagyon úgy tűnik, hogy máshogy fest. Eye-trackerrel vagy szép magyar nyelven szemmozgás-figyelő eszközzel megvizsgálva a kísérleti személyek sokkal többször pillantottak oda-vissza a lemásolandó ábráról a készülő másolatra, mint ahogy azt előzetesen gondoltuk. A kísérletben résztvevők általában először megnézték a kész ábrát, utána kiválasztották a megfelelő színű építőelemet, aztán megint visszaugrottak a másolandó képre és csak utána helyezték el az építőelemet a megfelelő helyre. Ebből azt a következtetést vonták le, hogy valószínűleg nem az történik, hogy egyszer szépen ránézünk az ábrára és utána kialakítunk róla egy “gazdag belső reprezentációt”, hanem első lépésként csak egyféle információt szedünk ki, utána egy kis részfeladatot elvégzünk (jelen esetben csak a színinformációt használtuk fel, ennek segítségével kiválasztottuk a megfelelő építőelemet) és utána visszamegyünk az ábrához, hogy a másik információt is megszerezzük, ami a következő részfeladat elvégzéséhez szükséges. Így tehát Clark szerint az agy nem úgy működik, hogy kap egy (itt vizuális) inputot, utána erről készít egy szép belső reprezentációt és a továbbiakban ezen a belső képen dolgozik, majd kiadja a parancsokat, hanem ennél egy sokkal interaktívabb kapcsolatban áll a külső környezettel; egyfajta külső memóriaként használja, amihez bármikor visszatérhet, ha szükség van rá egy feladat elvégzéséhez.
Lehet hogy én szimplán munkamemóriának hívnám a titok nyitját, hiszen nem fogok tudni eltárolni minden kis információt egyszeri rápillantásra, és nyilván vissza kell néznem, de ha nem lenne ott a környezet stabilan és megbízhatóan, akkor se tudnám (sokkal jobban) megjegyezni az összes építőelem színét ÉS pozícióját. Ugyanakkor Clark is csak annyit mond, hogy a szervezet igyekszik a lehető legkisebb energiabefektetéssel elfogadható eredményt elérni és ez az állítás igazából erre az esetre is ráhúzható, mivel tényleg jó eredményt fogunk elérni (ha hirtelen nem tűnik el a másolandó ábra) és nem is kell nagyon megerőltetnünk hozzá a memóriánkat, hiszen csak egy aspektust kell memorizálnunk és azt is csak annyi ideig, amíg el nem végezzük az adott részfeladatot (itt pl. a megfelelő színű építőelem kiválasztását), utána el is felejtjük és betöltjük a memóriánkba az új információt, a kiválasztott építőelem helyét. (Ez persze nem teljesen bizonyos, hogy így van, hiszen ahhoz, hogy tudjuk, hová kell visszanézni, lehet, hogy tudni kell azt is, hogy milyen színű téglalap pozícióját keressük, de lehet, hogy csak egy sokkal kisebb és egyszerűbben tárolható információ alapján keresünk. Például csak a szemmozgást tárolja el az agy és egyszerűen “tudja”, hogy hol járt legutoljára, így aztán csak oda kell majd visszaugrania.
Egy másik érv ugyanemellett az úgynevezett change-blindness, vagy változásra való vakság. Ez az a jelenség, amikor például van egy filmes hiba, például Frodón rajta marad az órája, ami eléggé feltűnő lehetne, de nem vesszük észre, mert teljesen másra koncentrálunk, mondjuk arra, hogy Frodó ledobja-e azt a nyamvadt gyűrűt a Végzet Hegyéről vagy sem. Ha például megnézik ezt a videót anélkül, hogy megnéznék a videóhoz tartozó leírást, feltűnik-e valami?
Nem? Nos, szomorkodásra semmi ok, mert ez teljesen természetes. Ha az ember el van merülve és le van kötve a figyelme, nem vesz észre apró (sőt nagy), a környezetében lezajló változásokat sem, akkor sem, ha végig odanéz, ahol a változás is bekövetkezik. Hogy lehet ez? Úgy lehet, legalább is a könyvben lévő magyarázat szerint, hogy nem raktározunk el minden apró részletet az agyunkban a külső környezetből, csak annyit és azt, amire szükségünk van az adott feladat elvégzéséhez, jelen esetben az események követéséhez a filmben. Frodó oda nem illő órája pedig semmilyen hatással nincs a történet menetére. Így ismét oda lyukadunk ki, hogy a környezet és az agy viszonya nem teljesen annyi, hogy az agy kap egy inputot, aztán processzál valamit és kiadja a feladat elvégzéséhez szükséges parancsokat, hanem egyfajta interakció alakul ki agy és környezet közt, melyben a külső környezet egyfajta kihelyezett memóriaként funkcionál.
Ide kapcsolható még egy érdekes fun fact. Ha vesszük mondjuk azt, hogy egy labdát szeretnénk elkapni, közben futunk utána, a legtöbb esetben nem elég a vizuális információ, hogy meghatározzuk a labda pontos pozícióját így úgy néz ki, hogy a labda útvonaláról való szemantikus tudásunkkal egészítjük ki - magunk számára is észrevétlenül - hiányos vizuális információnkat. Ugyanez a helyzet a kutyáknál is, akik bámulatos ügyességgel tudják elkapni a frizbit vagy a labdát. Nem lenne kielégítő önmagában a vizuális input számukra, hogy olyan pontossággal vetődjenek a levegőben a repülő csészealj után, ezért valószínű, hogy a vizuális információ egy szemantikus, előzetes tudással egészül ki az ő esetükben is... kivéve néhány szerencsétlenebb egyedet:
Nyelv, mint az elme állványzata
Gyakorlatilag mindenhol, ahol kognícióról és emberről együttesen beszélünk, kötelező megemlíteni az emberi nyelvet is, mint az emberiség egyik legnagyobb evolúciós vívmányát. Hogy jöhet a képbe, amikor a kiterjesztett elméről beszélünk? Az emberi nyelv legnagyobb csodája, hogy szimbolikus és ezzel együtt elemei szabadon és elméletben a végtelenségig kombinálhatók, mégis jól strukturált, hierarchikus (bár erről vannak másfajta elképzelések is) rendszert alkot. Clark szerint kiindulásként jó, ha úgy gondolunk a nyelvre, mint egy, az elmét gyakorlatilag átstrukturáló képződményre. Egyrészt önmagában az, hogy felcímkézzük a környezetünkben lévő dolgokat, olyan lehetőségeket teremt, mint a kategorizáció, a figyelem a kommunikáció szempontjából valóban releváns részletekre való irányítása, illetve az információs tér szűkítése, ami gyakorlatilag az előző, mivel azáltal, hogy valamire felhívom a kommunikációs partnerem figyelmét, egyben el is terelem minden másról.
Ezt hívja Andy Clark elegánsan a tér deskriptív komplexitása csökkentésének (reduction of the scene’s descriptive complexity).
Ha pedig a komplexitás csökkentéséről esik szó, akkor itt szeretném megemlíteni a könyvből azt a részt, ahol Clark válaszol arra, hogy miért badarság azt gondolni, hogy elménk kiterjesztett része nem képes olyan szabályokat felmutatni, mint a belső neurális folyamatok és így nevetséges is arról tárgyalni, hogy lehetnek-e külső tényezők is az elme részei vagy sem, hiszen nyilvánvalóan nem.
Temérdek komplex rendszerről lett már kimutatva, hogy szabályszerűen viselkedik, nem kell ehhez még élőnek sem lenni. Például számos hálózatnál megfigyelhető, hogy hatványtörvényt követ “a hangyakolóniáktól kezdve a Világhálóig”. Tehát, miért ne lehetne, hogy komplex agyunk együttműködve és gyakorlatilag beolvasztva magába a külső környezet egy részét, ne követhessen olyan szabályokat, melyek megfelelnek az ilyenfajta “szabálykövető” elvárásoknak?
Attól, hogy a könyvben oly sokszor emlegetett Otto mezei notesze nem egy bonyolult struktúra, integrálva a belső rendszerbe, azáltal, hogy a benne lévő információkat felhasználja, éppen ugyanazt a funkciót látja el, mint Inga emlékezete, aki a noteszben található információt az emlékezetéből hívja elő. De onnantól, hogy elő van hívva a szükséges információ, minden más folyamat Inga és Otto fejében akár meg is egyezhet. A notesz nélkül Ottónak azonban nem menne az egész komplex feladatsor végrehajtása.
Tehát Otto notesze szerves része lehet elméjének (az adott feladat elvégzésénél legalább is mindenképp), hiszen anélkül nem lenne képes bizonyos funkciók ellátására. Persze, furcsa, hogy egy kis papírcsomó része lehet egy ilyen bonyolult és csodálatos biológiai rendszernek, de ahogy magunk konstruáljuk a környezetünket és ezáltal saját agyunkat is, igazából bele is illhet a képbe.
A címkézés lehetőséget teremt újfajta kategorizációk megalkotására, a kép újrastrukturálására, illetve absztrakt csoportosítására is, melyet pusztán fizikai átcsoportosítással (egyik kupacba a szennyes, másikba a tiszta ruhák kerülnek) nem lennének megvalósíthatóak.
Azzal, hogy felcímkézzük a környezetünket, virtuális objektumokat hozunk létre, melyek egy közös kommunikációs csatorna részét képezik. Ezekkel a virtuális objektumokkal pedig szabadon garázdálkodhatunk, hiszen a címkék közösek és mindenki érti (persze csak az adott nyelv beszélőinek halmazában), hogy mire utal a másik fél velük. Clark úgy gondolja, hogy a címkézéssel saját elménket is átstrukturáljuk és képessé tesszük arra, hogy a jobb performancia elérése érdekében mindig a lényeges dologra tereljük saját figyelmünket. Így a nyelv egyfajta eszköze lehet az önfejlesztésnek.
Ez pedig a harmadik legfontosabb következménye annak, hogy szimbolikus nyelvet használó élőlények vagyunk. Képesek vagyunk saját gondolatainkra, gondolkodásmódunkra reflektálni és ezáltal fejleszteni tudjuk azt, a magasabb teljesítmény elérése érdekében. Tehát, ha például látjuk, hogy a magolással nem igazán megy a matematikai definíciók tanulása, akkor arról a stratégiáról, hogy szó szerint bebiflázzuk az egyébként számunkra semmitmondó szabályokat és képleteket, átváltunk egy másikra, amiben megpróbáljuk értelmezni a definíciót, esetleg elképzelünk néhány példát hozzá és a továbbiakban ezt az utat követve tanulunk tovább, amennyiben úgy látjuk, hogy ez az új módszer valóban növeli tanulási hatékonyságunkat. Ezáltal valóban egy önfejlesztési folyamatot gerjesztettünk magunkban, hiszen saját, kevésbé hatékony stratégiánkat váltattuk fel önreflekcióval egy jobb módszerre, mellyel jobb eredményeket lettünk képesek elérni.
Ezzel pedig elértünk mindenki kedvenc vesszőparipájához, az ember legkülönlegesebb tulajdonságához, ami a tudomány jelenlegi állása szerint egyedi az állatvilágban - ez a tudatelmélet vagy angolul a 'Theory of Mind'. Ez az a szuperképességünk, mellyel képesek vagyunk felfogni, hogy rajtunk kívül másoknak is vannak hiedelmei, előzetes tudásuk, melyek alapján következtetéseket és predikciókat készítenek és mi képesek vagyunk belehelyezkedni az ő helyzetükbe. Tudva, hogy ők mit tudhatnak és mit nem, predikciókat hozhatunk arról, hogy hogyan fognak cselekedni és így hatékonyabbá tenni a kommunikációt, illetve számos esetben egyáltalán működőképessé tenni, hiszen azt is tudjuk, hogy önmagában egy párbeszédből nem derülne ki sok minden. Kell hozzá az, hogy a kommunikációs partnerek tisztában legyenek a kontextussal, rendelkezzenek a szükséges előzetes tudással és meg legyen a közös kommunikációs eszköz, vagyis a nyelv.
Azzal, hogy egy ilyen szimbólumrendszert tartunk fenn magunkban és a környezetünkben, mellyel gyakorlatilag magunkat is alakítjuk és fejlesztjük, elhanyagolhatatlanná válnak a környezetünkben található nyelvi objektumok, mind írott, mind akusztikus formában. Ezek pedig hasonlóképpen képesek lehetnek gondolataink rendszerezésére, formálására és hatékonyabb stratégiák kidolgozására egyes feladatok elvégzéséhez, mint a “belső hang”, ami a matematikai definíciók bemagolása helyett egy másik, jobb módszer választására ösztönöz.
Az áhított teljesítmény elérése érdekében emlékeztetőket írunk, felírjuk a napi teendőket, összefoglalókat szerkesztünk, jegyzetelünk, aláhúzzuk és kiemeljük a fontos részeket egy szövegben. Emellett programokat írunk, amelyek segítenek a tanulásban, eszközöket készítünk, melyekkel gyorsabban tudjuk elvégezni a számításainkat, hatékonyabban tudunk haladni. Eszerint nem csupán magunkat szabjuk egyre hatékonyabb gondolkodókká, de a környezetünket is egyre jobban igazítjuk úgy, hogy könnyű legyen benne az önfejlesztés, a gondolkodás illetve a teljesítés. A könyvből idézve: “The human agent one might say, is nature's expert at becoming expert. ”
Így viszont megfordítható a kiterjeszthető-e az elme kérdés olyan formán, hogy leszűkíthető-e az elme? Képesek lennénk-e elérni ugyanazokat az eredményeket ezek nélkül a külső mankók nélkül? Elválasztható-e tőlem a jegyzettömböm, ami nélkül még azt se nagyon tudom, hogy másnap mit kell csinálnom és hová mennem? Lehet-e, hogy ezek nélkül a mára már szerves részeinkké vált külső objektumoktól megfosztva ugyanazok az emberek maradjunk? Persze, lehet. De képesek lennénk-e ezek nélkül egy olyan élet vezetésére, mint amilyet a minket körülvevő technikai eszközökkel alakítottunk ki?
Az utolsó gondolat, amit érdemes megemlíteni itt, a gesztikulációról szól. Tudom, ez már megint teljesen más téma, hogy jön ez ide? Az a mókás, hogy miközben minden ilyen apró példánál elgondolkodik az ember, hogy ez hogyan kapcsolódik a témához, egyre érthetőbbé válik, hogy a sok, látszólag teljesen különböző építőkocka mégis egy készletbe tartozik és fel lehet építeni belőle egy szép nagy birodalmi lépegetőt. Az viszont kérdéses, hogy ugyanúgy nem lehet-e felépíteni belőle mondjuk a batmobilt is, de ez azt hiszem, majdnem minden modellnél problémát jelent.
Miért gesztikulálunk?
Azt hiszem a legjobb, ha mi is azt a példát hozzuk, amit a könyv is Goldin-Medow 2003-as tanulmányát, ahol azt a kérdést teszik föl, hogy a gesztikuláló vajon tényleg csak kísérője a már teljesen kész, megformált gondolatok kifejezésének vagy ennél jóval több és valójában hozzáad valamit a nyelvi tartalomhoz. Ha viszont van valami más szerepe is, mint a már kész gondolatok kísérése, mi az? Goldin-Medow szerint az a legvalószínűbb, hogy a gesztikulációval felszabadítunk valamennyi kapacitást és így csökken a neurális terheltség szintje. Csakhogy felmerül a kérdés, hogy ha ezt kísérletesen próbáljuk vizsgálni, hogyan lehet kizárni azt a lehetőséget, hogy igazából csak annyi történik, hogy a nem gesztikuláló csoport csak azért teljesít gyengébben, mert le kell gátolnia az egyébként automatikus gesztikulációt. Szerencsére volt olyan személy, aki ugyan a "gesztikulálni szabad" csoportban volt, de nem gesztikulált (így vélhetőleg nem elfojtotta magában, hanem önkéntelenül nem gesztikulált). Ennek köszönhetően össze lehetett hasonlítani a "nem szabad gesztikulálni" csoport és a "szabad gesztikulálni" csoport nem gesztikuláló tagjainak teljesítményét és az eredmények azt mutatták, hogy mindkét esetben rosszabb volt az eredmény a gesztikuláló személyekhez képest.
Ez az egy eredmény természetesen nem eredmény, de mégis elgondolkodtató és felveti annak a lehetőségét, hogy talán tényleg van értelme máshogy tekinteni a képre és talán tényleg nem kizárólag az agy az, ami mindent csinál, mindent tud és minden mást irányít, hanem ennél valami sokkal szövevényesebb képet kapunk, ahol nem csak a szinapszisok, hanem az agy, a test és a környezet hármasa dinamikus, időben változó kognitív egészeket hoz létre, melyek szétkapcsolódnak és máshogy ismét összekapcsolódnak a megoldandó feladat természetétől függően.
Nem hiszem, hogy igazságot tenni a mi feladatunk lenne, de az a véleményem, hogy mindenképp hasznos elolvasni a könyvet, mert segít egy kicsit más megvilágításba helyezni a dolgokat, ami pedig minden téren jól jöhet.