A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.
Az alábbi keresődobozsegítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.
Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.
Precognox Blogkereső
Document
opendata.hu
Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.
A long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...
A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft.Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.
A QWERTY-hatás Casasanto és Jasmin által megalkotott kifejezés, melyet saját vizsgálatukban sikerült többször és több nyelven is kimutatniuk. (The QWERTY Effect: How typing shapes the meanings of words.” By Kyle Jasmin and Daniel Casasanto Psychonomic Bulletin & Review Psychon Bull Rev 19.3 (2012): 499-504. Web.)
Ezen felbuzdulva úgy döntöttünk, hogy mi is készítünk egy, ha nem is mindenben a tudományos normák szerinti felmérést, hogy vajon magyarban kimutatható-e a hatás. Mint már a korábbi posztban említettük, a magyar billentyűzet azért is érdekes ebben a dologban, mert nálunk éppen megfordulnak az arányok és több betűt bitorol a jobb oldal, mint a bal. Ez azért fontos, mert Casasantóék egyik, a QWERTY-hatást magyarázó elképzelése azon az alapon nyugszik, hogy azért részesítjük előnyben az inkább “jobb oldali” (több, a jobb oldalról származó betűt tartalmazó) szavakat, mert azon az oldalon kevesebb lehetőség közül kell választanunk, így gyorsabban és folyamatosabban tudjuk gépelni a szavakat, ez a fizikai sikerélmény pedig jó érzést vált ki bennünk. (Ping, R. M., S. Dhillon, and S. L. Beilock. "Reach For What You Like: The Body's Role in Shaping Preferences." Emotion Review 1.2 (2009): 140-50. Web.)
Az az állítás, hogy a könnyű dolgok pozitív érzetet keltenek, egyes kutatócsoportok szerint nem minden esetben állja meg a helyét. Casasantóék említenek egy olyan kutatást, ahol ezt a könnyű - pozitív társítást sikerül módosítani azáltal, hogy előzetesen megmondják, ha könnyűnek érzik a feladatot, az alacsonyabb IQ-ra utal. (Brinol, P., R. E. Petty, and Z. L. Tormala. "The Malleable Meaning of Subjective Ease." Psychological Science 17.3 (2006): 200-06. Web.)
Mindenesetre szerintem azt elhihetjük, hogy a gépelés esetében alapvetően akkor vagyunk boldogok, ha gyorsan megy. Ezen kívül C&J végeztek olyan RT (reaction time, vagy reakcióidő) kísérleteket, ahol kimutatták, hogy a jobb oldalról több betűt tartalmazó szavakat átlagosan gyorsabban tudják begépelni a kísérleti személyek.(A jobb oldal a kísérletvégzés nyelvén a kevesebb betűt tartalmazó volt, ezen kívül pedig az emberek nagy többsége jobb kezes, vagyis ezzel a kezükkel általában ügyesebbek is.)
Casasantóéknak kijött egy enyhe pozitív hatás, ami az ő összes kutatásukban szignifikáns lett. Az enyhe pozitív hatás annyit jelent, hogy a több jobb oldalról származó betűt tartalmazó szavakat pozitívabbnak értékeljük, mint a bal oldalról többet tartalmazó szavakat.
Casasantóék egy későbbi kutatása szerint ez még a balkezeseknél is így van, erre pedig úgy jöttek rá, hogy közben a hipotézisük megdőlt, legalább is német nyelven, mivel ott a jobb és a bal oldalon is ugyanannyi betű található. Erre azt a magyarázatot találták, hogy akkor a domináns oldali preferencia az, ami a qwerty-hatást magyarázza. Ugyanakkor a balkezeseknél is kimutatható a RSA, így aztán elveszítettük a fonalat, hogy tulajdonképpen mi az állítás és miért hívják QWERTY-hatásnak.
Saját kutatás eredményei
Ami a mi kutatásunkat illeti, a menetrend a következő volt:
A már meglévő emóció- és szentiment szótárainkból, ezentúl a wiki szótárunkból (ami a SZTAKI magyar wikipedia dumpjából általunk generált szógyakorisági tábla) válogattuk össze a szavakat, miután az eredeti (jobb - pozitív, bal - negatív) kezességi értékeket egyenként kiszámítottuk hozzájuk. Ezután kerestünk néhány, a 60-as évek után keletkezett szót is, mivel C&J cikkében az áll, hogy ezeknél a szavaknál erősebb a hatás. Ezeket a szavakat az Édes Anyanyelvünk c. folyóirat “Új szavak, kifejezések” rovatából gyűjtöttük. Ezeket a szavakat összesítve összesen 53 szóval folyt a vizsgálat.
Az olyan szavaknál, ahol volt valencia vagy szentiment érték, kíváncsiak voltunk, hogy mi történik akkor, ha a kezesség a valencia ellenében van, vagy hogyha azzal megegyezik. Bővebben ez annyit jelent, hogy ha például volt egy pozitív valenciájú szó, (pl.: humor) ami több betűt tartalmazott a jobb, mint a bal oldalról, akkor ezt neveztük kongruensnek, mivel a valencia és a kezesség is “jó” volt. Ugyanígy, inkongruens szóról akkor beszélünk, ha a valencia és a kezesség ellentétes értékűek, vagyis egy pozitív jelentésű szó például több betűt tartalmaz a bal oldalról, mint a jobbról. A kérdőívben ezeket a szavakat kellett értékelniük a kitöltőknek egy 10-es skálán, kellemesség alapján. A kérdés - amennyire csak lehetett - általánosan volt megfogalmazva, hogy például ne fordítsanak különös figyelmet arra, hogy kifejezetten gépelni szeretik-e ezeket a szavakat, hiszen C&J munkája szerint ez a hatás olvasáskor is kimutatható, ugyanis gyakorlatilag egy enyhe jelentésmódosulásról van szó.
A kérdőívet végül 501-en töltötték ki, ebből az adathalmazból készítettük el a statisztikai elemzéseket. Az adatokra illesztett lineáris modellek illetve általánosított lineáris modellek nem támasztották alá, hogy létezne QWERTY-hatás magyar nyelven. Ahogy az alábbi ábrán is látható, nem találtunk kapcsolatot az RSA (right side advantage) és a valencia között. Emiatt nem sikerült kimutatnunk azt sem, hogy a magyarban megfordulna a hatás.
A szavaknak azonban ismertük a szentiment- és emócióértékeit és sikerült kimutatnunk, hogy ezeknek szignifikáns hatása van a szavak kellemességére.
Az alábbi két ábrán látható, hogy a negatív és a pozitív jelentésű szavak szépen kettéválnak, ugyanakkor az RSA-val nincs összefüggés. Ugyanis a feltételezett kapcsolat természete szerint azt várnánk, hogy inkongruens esetben az RSA hatása gyengítse a szentiment illetve az emóció hatását (vagy a fordított hatás jegyében erősítse). Ezzel szemben az RSA-nek nincs hatása a szó kellemességének megítélésére, csak az emóciónak és a szentimentnek.
Tehát az aszimmetrikus elrendezés kutatásunkban nem befolyásolta a szavak kellemességét. Erre azonban Casasanto & Jasmin is ráébredtek, ahogy azt fentebb már említettük.
Számukra ez azt bizonyítja, hogy másik hipotézisük - miszerint a legtöbb ember jobbkezes és emiatt erre a kezére ügyesebb is, így ezen az oldalon gyorsabban és folyamatosabban gépel, ami pozitív jelentésárnyalatot adhat a szavaknak - megállja a helyét.
Mi nem egészen gondoljuk így, de mint mondtuk, a mi kutatásunk kisebb kaliberű volt, mint az övék, ugyanakkor a hatás robosztusságáról nem tudunk beszámolni, csak arról, hogy mi nem találtuk meg.
Problémák
Egyéb kérdések is felmerülnek, mint a LanguageLogon több hozzászóló által is említett probléma: nagyon kevesen vannak olyanok, akik képzettek vakonírásban, vagyis kevesen használják “ideálisan” a qwerty billentyűzetet . Ez maga után vonja, hogy van, aki egy ujjal nyomogatja a klaviatúrát, hozzásegít a másik kezével az egyik oldal nyomogatásához és így tovább. Egyszóval nem biztos, hogy a valóságban létezik, vagy legalább is éles határ lenne a Casasantóék által említett TGB vonal. Márpedig ez a határvonal-kérdés eléggé fontos, hiszen az aszimmetria ettől a TGB vonaltól függ, ha az első elkepzelésüket is számításba akarjuk venni, hiszen valójában az eredeti hipotézisük csak a német nyelvre dőlt meg. Mindazonáltal a határvonal a német esetében is fontos, mert jobb kézzel a konvenció szerint a TGB vonaltól jobbra elhelyezkedő betűket gépeljük,ha viszont ez a valóságban nincs így, akkor tulajdonképpen mi alapján is soroljuk be a szavakat jobbkezes illetve balkezes csoportokba?
Babanevek
Ezektől az eredményekről egy pillanatra elvonatkoztatva Casasantóék egy további kutatásában kimutatott babanév-eltolódási tendenciát mi is felfedezni vélünk.
(A fenti ábra Casasantóék cikkéből származik: Casasanto, D., Jasmin, K., Brookshire, G. & Gijssels, T. "The QWERTY Effect: How typing shapes word meanings and baby names". In P. Bello, M. Guarini, M. McShane, & B. Scassellati (Eds.), Proceedings of the 36th Annual Conference of the Cognitive Science Society. Austin, TX: Cognitive Science Society, 2014.)
A jelenség egy kicsit részletezve annyiból áll, hogy a névadási szokások az elmúlt 50 év alatt az olyan nevek felé tolódtak el, melyek több, a jobb oldalról származó betűt tartalmaznak. Ez ugyanakkor lehet, hogy nem a számítógép (értsd: billentyűzet) elterjedésének, hanem egy ciklikus tendencia egyik tipikus szakaszának tudható be. Ezt az elképzelést a Language Logon szépen végig is vezették, akit érdekel olvassa el: QWERTY again. Túl az ebben a posztban említett aggályokon, azért sem túl meggyőző ez az elképzelés a névadásról, mert az aszimmetria nem vonatkozik minden nyelvre, így aztán nem is adhatják azt a magyarázatot, hogy ez az egész jelenség a QWERTY-billentyűzetnek tudható be, hiszen jobbkezes emberek a QWERTY előtt is léteztek. Akkor viszont sokkal logikusabb magyarázatnak tűnik a ciklikusság.
Az alábbi ábrán látható a mi eredményünk, ez csupán a 2000-2014 közötti időszakról szól. Fontos megjegyeznünk, hogy mi is összevontunk a fiú és lányneveket az ábránkon. A grafikon alapjául a Keresztnevek Tára utónév statisztikája szolgált.
Igazából itt is látszik egy lefelé ívelő tendencia kezdete 2013 körültől 2015 felé közeledve, ami esetleg utalhat a ciklikusságra.
Van egy olyan enyhe utóíze az egész Casasanto-féle kutatásnak számunkra, hogy nem állítottak semmit, de azt bebizonyították. A kiinduló hipotézist a kutatás közben megváltoztatni alapból nem túl szép dolog és ezek után valami olyan eredményre jutni, aminek semmi köze a billentyűzethez, kissé furcsa.
Bármi is legyen az igazság, a QWERTY-leosztást sok szempontból megnézték már és ha ez a végeredmény nem is adott megerősítő eredményt a QWERTY-hatás létezésére vonatkozóan, ez is egy eredmény, amit hasznos lehet prezentálni.
Ha valaki biztosra akar menni, hogy a gépelési szokása miatt, vagy csupán azért, mert jobbkezes, nehogy pozitívabbnak érzékelje például a ‘killing’ szót, annak itt egy új alternatíva: BeeRaider(ezt még nem teszteltük :))
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Mielőtt a kedves olvasó azt hinné, megőrültünk a nyári melegben, gyorsan szögezzük le; az adatok alapján nagyon valószínű hogy ha szóasszociációs vizsgálat alá vetnénk, akkor előbb-utóbb eljutnánk a vajhoz - vagy nem....
Szóasszociációs gráfunk két táblára épül, melyek itt találhatóak. Az oldalon rögtön kiderül, hogy az adatokat 1983-ban és 1985-ben vették fel, 10-14 és 18-24 évesek körében, azaz mára mára negyvenes, ötvenes éveikben járnak az adatközlők. Azóta már vajat sem használunk annyira, az asszociációk pedig érzékenyek az ilyen változásokra, de szerencsére az ilyen kapcsolatok száma nem túl magas a táblázatokban.Maga a gráf minden hívószót és választ tartalmaz mint csomópont, nagyságukat az ábrán PageRank értékük adja. Az élek egy hívószó-válasz relációt jelenítenek meg, vastagságuk a kapcsolat gyakoriságának súlyán (az hány válaszadó adta meg az asszociációt) alapul.
A szóasszociációs vizsgálatok nem öncélúak. Egyrészt betekintést nyújtanak abba, hogyan tárolja az elme a szótári elemeket, másrészt akár iparban is lehet alkalmazni egy ilyen adathalmazt, pl. a keresés során kiterjeszteni a query-t az asszociációkkal (esetleg valamilyen megkötést alkalmazni egy szemantikus adatbázis segítségével) vagy faceteket képezhetünk a további kereséshez. Akit mélyebben érdekel a téma, az olvassa el ezt a tanulmányt.
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Két korábbi posztunkban (itt és itt) megnéztük, hogy a CHILDES adatbázis magyar nyelvű adatain hogyan változik a gyermekek összesített szótármérete és a lexikai elemek közötti kapcsolatok száma 17-36 hónapos korig. A mostani posztunkban ugyanezekkel az adatokkal dolgozunk, azonban a gyermekek nyelvfejlődését egyedileg vizsgáljuk, sőt, az egyik anyuka nyelvi hálózatát is górcső alá vesszük. A hálózati megközelítés mellett utánanéztünk a nyelvelsajátítás hagyományos irodalmának is, és ezeket kombinálva próbáljuk feltárni a kapott összefüggéseket.
Bevezetés
A gyermeknyelv vizsgálatával számos tudományterület, köztük a pszichológia, a szociolingvisztika, a nyelvtudomány és az orvostudomány is előszeretettel foglalkozik. Ennek oka részben abban keresendő, hogy a gyermekek nyelvi fejlődése, az anyanyelv elsajátításának folyamata rendkívül izgalmas és lenyűgöző. A másik ok, amiért olyan nagy figyelem irányul rá, az az, hogy a gyermeknyelv egyfajta „kulcs” az emberi nyelv természetének és kialakulásának a megértéséhez (vö. Tancz 2011). Az élénk vizsgálódás ellenére mégis azt kell mondanunk, hogy a nyelvelsajátítás máig az emberi lélektan egyik legrejtélyesebb jelensége. Valójában nem tudunk kielégítő választ adni arra a kérdésre, hogy miként jut a gyermek a nyelvi rendszer birtokába (vö. Lengyel 1981). Két fő forrásként mindenesetre a biológiai örökséget és a környezet szerepét tartjuk számon (vö. Tancz 2011).
A nyelvelsajátításban – akárcsak más pszichológiai jelenségek kialakulásában – bizonyos életkoroknak kitüntetett szerepe van (vö. Tancz 2011). Az elsajátítás, illetve a kommunikáció és a beszéd kialakulása folyamatos és ugrásszerű fejlődési menetekben zajlik, és egymást követő, megfordíthatatlan fejlődési szakaszokhoz kötött. A szakaszok univerzálisak, azaz minden gyermekre jellemzőek – nem kapcsolódnak földrajzi területekhez, nyelvekhez, nyelvtípusokhoz vagy kultúrákhoz –, azonban azok kezdete, időtartama és módosulása egyénenként változhat (vö. Kenesei 2004).
Tancz (2011) az alábbi legfontosabb szakaszokat különíti el a gyermekek nyelvi fejlődésében:
Fejlődési szakasz
Időszak
Magzati kommunikáció
a születésig
Preverbális szakasz
csecsemőkor
Egyszavas kijelentések szakasza
10-18. hónap
Távirati beszéd és szótári robbanás
1,5-3 éves kor
A nyelv kialakulása alapfokon
3-6 éves kor
Fokozatos gazdagodás és bonyolódás
7 éves kortól
Módszertan
A hálózati vizsgálódás alapjául Jinyun Ke és Yao Yao 2008-as tanulmánya szolgált, akik 12 angol anyanyelvű gyermek, 6 fiú és 6 lány nyelvi hálózatát elemezték. Mivel a CHILDES adatbázis nem bővelkedik magyar nyelvű adatokban, mi összesen 5 gyerek, Andi, Éva, Gyuri, Miki és Zoli nyelvfejlődését tudtuk szemügyre venni. Az eredeti tanulmányhoz hasonlóan kétféle hálózattípuson követtük a gyerekek nyelvi adatainak időbeli változását. Az egyik hálózattípus úgy épül fel, hogy a szavak és a köztük lévő kapcsolatok hónapról-hónapra kumulálódnak (accumulative network), a másik hálózattípus pedig csak az adott hónapban elhangzott szavakat és köztük lévő kapcsolatokat tartalmazza (stage network).
Ezeket a hálózatokat két mutató szerint vizsgáltuk meg. Az egyik mutató a gyermekek szótármérete, ami azt fejezi ki, hogy hány szót tartalmaz egy gyermek nyelvi hálózata, azaz hány szót használ beszéd közben. A másik az átlagos fokszám, ami pedig annak a mutatója, hogy egy gyermek nyelvi hálózatában egy szó átlagosan hány másik szóhoz kapcsolódik, tehát mennyire tudja a gyerek egymással kombinálni a szavakat. A szótárméret és a fokszám mellett kíváncsiak voltunk, hogyan alakul a gyermekek lexikai diverzitása, amelyet úgy kapunk meg, ha kiszámoljuk, hogy a gyermek megnyilatkozásaiban jelen lévő összes szó hány százaléka egyedi szó. A lexikai diverzitás tehát a lexikai gazdagságot, változatosságot fejezi ki.
Ezeket a mutatószámokat párhuzamban állítjuk az egyik gyermek és édesanyjának nyelvi gráfjának segítségével, amikkel megvizsgáljuk, hogy mennyire van szinkronban a gyermek nyelvi fejlődése az anyuka beszédével.
A hálózati megközelítés lehetővé teszi, hogy könnyedén megvizsgálhassuk, mely szavak töltik be a legfontosabb szerepeket a gyermekek és az anyák nyelvi hálózatában. Az eredeti tanulmányban a HITS algoritmust használták e célból, amely segítségével ún. hub és authority elemeket azonosíthatunk egy hálózatban. A hubok azok az elemek, esetünkben szavak, amelyek az információt tartalmazó szavakkal kapcsolódnak össze. Az authority elemek azok a szavak, amelyek az információt tartalmazzák. Minél jobb authority szavakkal kapcsolódik össze egy hub szó, annál jobb hub, és annál jobb egy authority szó, minél jobb hubok linkelik.
A jelenlegi kutatásunkban a 17. és a 36. hónap közötti nyelvfejlődésre fókuszálunk, ezért tekintsük meg közelebbről ezt az időszakot a nyelvelsajátítás hagyományos szakirodalma és az általunk is alkalmazott hálózati megközelítés alapján!
A hálózati megközelítés eredményeinek összevetése a hagyományos szakirodalommal
A szótárméret és az átlagos fokszám változása
Az általunk vizsgált időszak kezdete az ún. „egyszavas kijelentések”-szakasz végére esik. Körülbelül a 10. és a 18. hónap között jelennek meg az egyszavas kijelentések (pl. mama, bácsi, vauvau stb.), amelyek Cole és Cole (2000) véleménye szerint egy egész mondatot is jelölhetnek. Tulajdonképpen ez az az időszak, amelyben a később az egész életünket végigkísérő komplex kommunikáció megjelenik (vö. Szomor 2009). Az adatbázisban csak a Zoli nevű kisfiúval készült felvételek esnek erre az időszakra, az ő nyelvfejlődését 17-26. hónapos koráig tudjuk követni. Az 1. és 2. ábra jól mutatja, hogy mindkét megfigyelt mutató (szótárméret és átlagos fokszám) jóval alacsonyabb, mint a következő nyelvfejlődési szakaszban, ahol robbanásszerűen megnő a használt szavak mennyisége és a köztük lévő kapcsolatok sűrűsége is.
Ez egybevág a szakirodalomban megfigyeltekkel, ugyanis azt olvashatjuk, hogy valamikor másfél-kétéves kor környékén megváltozik a gyermekek beszédprodukciója, látványosan gazdagodni és bonyolódni kezd a nyelvhasználatuk. E változás a lányok esetében kissé korábban, a fiúknál később következik be (vö. Tancz 2011). A gazdagodás szótári robbanást jelent, amelynek során ugrásszerűen nő a szókincs, az aktív és a passzív szavak tekintetében egyaránt (vö. Butzkamm- Butzkamm 2008). A bonyolódás alatt azt értjük, hogy a gyermek elkezdi kombinálni az aktívan használt szavakat - megjelennek tehát a kétszavas kijelentések. A gyermek ekkortól kezdi anyanyelve szintaxisát megérteni (vö. Herrmann-Fiebach, 2007:69). Fokozatosan eljut a szómondatoktól az ún. telegrafikus beszédhez, amely már a mondatszerű közlések előhírnöke. Zoli nyelvi hálózatai alapján is levonhatóak ugyanezek a megállapítások, az ő esetében 20 hónapos kortól beszélhetünk szótári robbanásról és bonyolódásról. Ekkor a nagyjából 20 szavas szótára hirtelen 1000 szó fölé, a szavak átlagos fokszáma pedig kb. 2-ről 4,5 fölé emelkedik, és egyik sem tér vissza ilyen alacsony szintre. Az 1. videó Zoli kumulatív nyelvi hálózatának növekedését mutatja hónapról-hónapra, a hirtelen szótári robbanását 0:07-nél láthatjuk.
1. videó
Ebben az időszakban, de kicsit később alakul ki az ún. flexiós beszéd, amikor a gyerekek elsajátítják a különböző nyelvtani elemeket (pl. toldalékok, igekötők, névelők), és egyre bonyolultabb szerkezetű mondatokat képesek közölni és megérteni (részletesebben l. Gósy 2005). Az alaktani szabályokat elsajátítva a gyermek gyakran már nem a környezetéből hallott szóalakokat utánozza, hanem a különböző nyelvtani elemek használati szabályainak felismerése után maga igyekszik megalkotni a megfelelő formákat. A grammatizálódási folyamatban így szükségszerűen megjelenik a túlszabályosítás is, például mikor Miki a „patkánnyal” helyett „patkányval”-t, „söpör” helyett „söpöz”-t mond.
Az 2. videó Miki, a 3. videó Éva, a 4. videó Andi kumulatív nyelvi hálózatának növekedését mutatja hónapról-hónapra.
2. videó
3. videó
4. videó
Andi, Éva, Gyuri és Miki nyelvfejlődéséről már a távirati beszéd és szótári robbanás időszakából (nagyjából 1,5-3 éves korig) vannak adataink, de Zoli nyelvi adatai is átlógnak erre az időszakra. A szótárméret és az átlagos fokszám változásáról az öt gyerek nyelvi hálózata alapján azt állapíthatjuk meg, hogy a gyerkőcök nyelvi fejlődése alapvetően különböző, de egyes szempontok szerint mégis hasonló utat járnak be (1. és 2. ábra). Ez abban nyilvánul meg, hogy mind a szótárméret, mind a fokszám ingadozik az idő előrehaladtával, habár minden gyereknél más-más hónapokban. A jelenség legjobban Mikinél figyelhető meg, akinek nyelvi fejlődéséről 13 hónapon keresztül készültek felvételek. Az ő esetében 4 ilyen hullámot figyelhetünk meg, pontosabban 4 és felet, ugyanis az utolsó két hónapban valószínűleg egy 5. hullám van készülőben. De a többi gyereknél, akiknek minimum 3 hónapnyi beszédanyaguk rendelkezésünkre áll, is tisztán látszanak az ingadozások.
1. ábra
2. ábra
A szótárméret és az átlagos fokszám kapcsolatát vizsgálva az eredeti tanulmány szerzői arra jutottak, hogy azok ellentétes irányban korrelálnak egymással. Tehát az a gyerek, akinek kifejezetten magas a szókincse, az átlagosnál kevésbé kapcsolja egymáshoz az ismert szavakat, megnyilatkozásaiban a sok általa ismert szóból profitál. Míg az a gyerek, akinek a többiekénél alacsonyabb a szókincse, az átlagos fokszáma magasabb, magyarán hiába ismer viszonylag kevés szót, azokat nagyon jól tudja egymással kombinálni. A magyar adatokat kicsit nehezebb volt egymással összehasonlítani, ugyanis a gyerekekkel nem egységes korban készültek a felvételek, azonban vannak olyan időszakok, amikor több gyerekről egyszerre is vannak adataink (pl. 25-26 hónapos korban), valamint az egész időszakra nézve is levonhatunk következtetéseket. A magyar nyelvű adatok az angol nyelvű adatokhoz hasonlóan együttjárást mutatnak a szótárméret és az átlagos fokszám között, de érdekes módon azzal ellenkező irányút. Az általunk vizsgált öt magyar nyelvű gyermek esetében ugyanis, ha valamelyik gyereknek nőtt a szótármérete, az átlagos fokszáma is magasabb lett, és fordítva (3. és 4. ábra).
3 évesen a gyermek már elismétli a 3-4 szavas mondatokat is. Expresszív (kifejező, aktív) szókincse 900-1000, míg receptív (megértő, passzív) szókincse 2000-3000 szóra tehető (Pléh, 2006). Ebben az időszakban használja a többes számot és a névmásokat is. Ekkor jön el az ún. „verbális mámor” időszaka is, amikor az igék használata dominál, és már nem ritkák a többszörösen összetett mondatok sem (vö. Gósy 1984; 1999). Megjelennek a párbeszédek is, majd a 3. év végére a gyermek képessé válik 4-5 elemből álló mondatok képzésére. Ebből a korból Éva és Miki adatait tudjuk megvizsgálni. A szótárméret tulajdonképpen az expresszív szókinccsel egyezik meg. Éva éppen egy növekvő szakaszban volt 3 éves kora környékén, az ő szótármérete 35. hónapban meghaladta az 1500-at, tehát az átlagosnál bővebb expresszív szókinccsel rendelkezett ebben az időszakban. Miki szótármérete, aki egy csökkenő szakaszban volt éppen, nagyjából 400 volt a 36. hónapban, míg az előtte való időszakokban a 800 körüli szótárméretet is elérte. Azonban még így is kicsit alacsonyabbnak számít a szótármérete az átlagos megfigyeléseknél.
3. ábra
4. ábra
A lexikai diverzitás
A szótárméret és az átlagos fokszám mellett érdemes a gyermekek lexikai diverzitását, változatosságát is megvizsgálni, hogy jobban feltárhassuk a növekvő és csökkenő időszakok közötti összefüggéseket. Az 5. ábrát a 1. és 2. ábrával összehasonlítva jól látható, hogy azokban a rövid időszakaszokban, amikor a szótárméret és az átlagos fokszám megnő, a lexikai diverzitás éppen lecsökken, és amikor előbbiek lecsökkennek, utóbbi megnő.
5. ábra
Az eddigiek alapján azt az elméletet állíthatjuk fel, hogy a gyermekek 1,5-3 éves koruk között több egymást követő etapban sajátítják el a nyelvet, amelyet a mutatószámok hullámzása is mutat. Vannak olyan időszakok, amikor a gyermekek új szavakat próbálgatnak, amiknek éppen akkor tanulják a jelentését, használatát, és még nem tudják a szavakat más szavakkal kombinálni. Ebben az időszakban a lexikai diverzitás magas lesz, hiszen az anyukájukat vagy a környezetükben lévő más személyeket ismételgetve próbálgatják a szavakat, és a próbálgatások közben sokszor el is hibázzák a hangalakokat, amelyek mind különböző lexikai elemeknek fognak minősülni. Viszont mivel nem ismerik még ezeknek a szavaknak a használatát, nem kombinálják a szavakat sem egymással, sem a szókincsük már meglévő elemeivel, így a szótárméret és az átlagos fokszám is alacsony lesz. Feltételezzük, hogy ezek olyan szituációkban vagy olyan témákkal kapcsolatban jönnek elő, amikkel a gyermek még nem találkozott, ezért a szókincsében még nincsenek meg a szituációhoz alkalmas kifejezések, hanem környezetétől próbálja a helyes szavakat elsajátítani. Emellett vannak olyan időszakok, amikor a gyerek a már elsajátított szókincsét használja, olyan szavakat, amiknek ismeri a használatát, jelentését és könnyedén kombinálni tudja azokat. Ekkor a lexikai diverzitás alacsony lesz, hiszen a szavakat már tudatosan használja, többször is a szituációban, és a szavak hangalakja is viszonylag egységes. A szótárát nagyobb teljességében tudja használni és a már ismert szavakat könnyedén egymáshoz tudja kapcsolni. Feltételezzük, hogy ezek olyan szituációkban vagy olyan témákkal kapcsolatban jönnek elő, amikkel a gyermek már találkozott, és a szókincsében már megvannak a szituációhoz illő szavak. Mivel a gyerekek különböző mértékben, időpontokban és gyakorisággal találkoznak ismert és ismeretlen szituációkkal, nem meglepő, hogy nyelvelsajátításuk különböző utakat jár be. Emellett bizonyára különböző biológiai tényezők is közrejátszanak a gyerekek nyelvelsajátítási folyamatainak egyediségében.
Ami pedig csöppet sem elhanyagolható tényező a gyermeki nyelvelsajátításában, az az édesanya szerepe, amellyel a következőkben foglalkozunk.
Miki és Miki anyukája
5. videó
Bruner (1980) szerint a gyermek nyelvelsajátításában az anya és a gyermek ugyanolyan fontos szerepet játszik, melynek során az anya és gyermeke egy közös problémamegoldó folyamatban vesznek részt. A folyamat során az anya a gyerek nyelvi próbálkozásaira neki megfelelően, egyéni módon reagál, miközben a gyermek lehetőséget kap az anyai beszéd utánzására. Az utánzás az életkor előrehaladtával egyre kevésbé jellemző. Egy 2 éves gyermek megnyilatkozásainak még a 20%-a utánzás, egy 3 éves gyermek beszéde pedig már csak 2%-ban ismétli környezetének beszédét. Az utánzás tehát egyrészt arra szolgál, hogy a gyerek bővíteni tudja a saját rendszerét, másrészt ezen keresztül tudja a társas szerepeket is gyakorolni (vö. Klein 2011).
Az édesanyák részéről jellemző a dajkanyelv, amely a világ talán összes országában létezik. A dajkanyelvben a kisgyermek bizonyos kezdetleges, de állandóan visszatérő hangjaihoz, hangsorozataihoz az édesanya és a gyermek környezetében élő más személyek bizonyos fogalmakat kapcsolnak. (pl.: papi, bibis) A dajkanyelv jellegzetességei közé tartoznak az egyszerű szavak, az egyszerű mondatok, a tiszta, egyértelmű hangsúlyozás, a magas hangfekvés és a kérdő jellegű intonáció a mondatok végén (vö. Klein 2011). A dajkanyelv hasznosságáról/károsságáról megoszlanak a vélemények.
Az édesanyák közül Miki anyukájának a megnyilatkozásait tudtuk könnyedén elkülöníteni a többi társalgásban résztvevő megnyilatkozásaitól, de a kettejük adataiból is nagyszerű összefüggésekhez juthatunk. Az 6., 7. és 8. ábra tanulságos abból a szempontból, hogy Miki és Miki anyukájának megnyilatkozásai látványosan együttmozognak a szótárméretet, az átlagos fokszámot vagy a lexikai diverzitást figyelve, majd 3 éves kor környékén történik valami, és a két vonal egymáshoz való viszonya megváltozik. Miki 3 éves kora előtti megnyilatkozásait anyukájánál kisebb szótárméret, kisebb átlagos fokszám, és nagyobb lexikai diverzitás jellemzi. Tehát kevesebb szót használt, kevésbé tudta őket kombinálni, mint édesanyja, azonban több féle szót használt, ami valószínűleg azért van, mert az éppen gyakorolt szavakat különböző formában ejtette ki, pl. „dódítta”, „gyógyítta” a „gyógyította” helyett. A 35. hónapban azonban Miki anyukájának extrém módon megnőtt a lexikai diverzitása Mikihez képest, az átlagos fokszáma lecsökkent, a szótármérete pedig közel azonos volt. Az egyik magyarázata ennek a jelenségnek, hogy Miki anyukája visszavett a dajkanyelvből, és elkezdett Mikivel bonyolultabb szerkezetekkel és gazdagabb szókinccsel kommunikálni, mivel Miki nyelvi fejlődése 3 éves kora környékére elérkezett arra a szintre, hogy ezt is megértse.
6. ábra
7. ábra
8. ábra
Hubs & authorities
Ke és Yao tanulmányukban arra jutottak, hogy az édesanyák hub és authority elemei általában névmások, névelők, és nem tartalommal bíró szavak. A „you”, „it”, „that” és „and” minden anyánál beletartozott az első öt hub szóba, az „a”, „the”, „you”, „that”, „it”, „your” és „in” pedig tipikus authority szavak voltak. A gyermekek hálózatainál pedig azt találtak, hogy kezdetben még tartalomszavak is megjelennek hub és authority szavakként, azonban a későbbiekben a tartalom nélküli szavak veszik át a helyüket, amilyeneket az anyák nyelvi hálózatai is tartalmaznak.
A szakirodalomban is azt találjuk, hogy a telegrafikus beszéd időszakában a gyermek úgy kapcsolja a szavakat egymáshoz, hogy közben nem használ funkciószavakat (vö. Tancz 2011), amely tehát szinkronban van az előbbiekkel. Ez a funkciószavak használatával kapcsolatos kutatássorozatunk szempontjából külön érdekes.
Az általunk kapott eredményeket itt lehet jobban megvizsgálni. A táblázatban a szavakat a hub és authority értékeiknek megfelelően csökkenő sorrendben szerepelnek. Az anyukák közül Miki anyukáját, a gyerkőcök közül Mikit és Zolit érdemes figyelnünk, mivel az ő nyelvi fejlődésüket tudjuk leghosszabban követni. Miki anyukájának hub szavai között mi is főleg funkciószavakat láthatunk, pl. „az”, „jó”, „és”, „igen”, „nem”, de emellett megjelenik Miki és a többi családtag neve is. Miki anyukájának authority szavai között szinte ugyanazok a szavak jelennek meg, csak más sorrendben. Miki hub és authority szavai között anyukájához képest több tartalomszó bukkan fel („bácsi”, az „embej”, a „néni”, a „kávé”), valamint az anya megszólítása is megjelenik többféle alakban („anyu”, „anu”, „anya”), ezenkívül olyan igéket fedezhetünk fel, mint a „fidej”, a „meséj” vagy a „tudom”. Emellett tartalom nélküli szavakból is találunk sokat, pl. „hm”, „igen”, „nem”, „de”, „jó”. A 36. hónap felé haladva mindkét szócsoportra jellemző, hogy egyre kevesebb tartalomszó foglal el előkelő helyet a rangsorokban. Zolinál is hasonlóakat figyelhetünk meg. Mindkettejüknél érdekes, hogy az „én” szó vagy olyan udvariassági szavak, mint a „kérem” csak később jelennek meg.
Konklúzió
Végezetül pedig üzenjük az összes rossz gyereknek, akik túl sokat használják a „nem” szót és túl keveset a „kérem”-et, hogy jól meggráfoljuk őket, ha így viselkednek!
IRODALOM
Butzkamm, W.-Butzkamm, J. 2008. Wie Kinder sprechen lernen. Tübingen, Francke Verlag.
Cole, M.-S.R. Cole 2000. Fejlődéslélektan. Budapest, Osiris.
Gósy M. 1984. Hangtani és szótani vizsgálatok hároméves gyermekek nyelvében. Nyelvtudományi értekezések 119. Budapest, Akadémiai Kiadó.
Gósy M. 1999. Pszicholingvisztika. Budapest, Corvina.
Gósy M. 2005. Pszicholingvisztika. Budapest, Osiris Kiadó.
Herrmann, C.-Fiebach, C. 2007. Gehirn und Sprache. Frankfurt, Fischer Verlag.
Ke, J – Yao, Y. 2008. Analyzing language development from a network approach. [http://arxiv.org/ftp/cs/papers/0601/0601005.pdf]
Kenesi I. szerk. 2004. A nyelv és a nyelvek. Budapest, Akadémiai Kiadó. 190-209.
Klein Á. 2011. A nyelvelsajátítástól a nyelvtanulásig. Anyanyelvelsajátítás – kétnyelvűség – idegennyelvűség. [http://janus.ttk.pte.hu/tamop/tananyagok/nyelv_elsajatitas/index.html]
Lengyel Zs. 1981. A gyermeknyelv. Budapest, Gondolat Kiadó.
Pléh Cs. 2006. A gyermeknyelv. In. Kiefer Ferenc szerk. Magyar nyelv. Budapest, Akadémiai Kiadó.
Szomor É. 2009. Kommunikáció és nyelvfejlődés. In. Balázs I. szerk. Gyerekek. Módszertani ajánlások a gyerekekkel végzett munkához a Biztos Kezdet program munkatársai számára Módszertani kézikönyv I. Budapest, Szociálpolitikai és Munkaügyi Intézet. 75-87.
Tancz T. 2011. A kommunikáció és a nyelv fejlődése a kora gyerekkorban. [http://janus.ttk.pte.hu/tamop/tananyagok/kommunikacio_es_fejlodes/index.html]
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Már a beharangozó óta nagy izgalommal vártuk az Agymanók (eredeti címén: Inside Out) egész estés alkotást a Pixar Stúdiótól. A film rendezője az Oscar-díjas Pete Docter, akitől a mozifilm ötlete is származik. A film gondolata legelőször 2011-ben vetődött fel benne: "Mi lenne, ha film készülne egy olyan helyről, amelyet mindenki ismer, de még senki sem látott: az emberi elme belsejéről?" A történet egy kislány fejében játszódik, s azt mutatja be, hogyan működnek benne az érzelmek a mindennapi élet során.
Mivel az emóciók nekünk is a szívügyünk (l. pl. ezt, ezt és ezt), gondoltuk, egy posztot a kedves és elgondolkodtató mesének szentelünk.
Riley egy hétköznapi lány, aki Minnesotában él egy nagy kertes házban, mókás szüleivel, és sok-sok barátjával. Az ő tudatába nyerünk bepillantást a mese által, ahol Derű, Bánat, Harag, Undor, és Majréérzelmekkel találkozunk. Az érzelmek Riley agyának központjában, a Fejhadiszálláson laknak, ahonnan a kislány mindennapi életét irányítják. Riley személyiségét az úgynevezett "Személyiség szigetei" határozzák meg, melyet a lány életének nagy pillanatai, a főemlékek működtetnek.
Rileyt rendkívül boldog gyerekkorral áldotta meg az ég, ám amikor tizenegy éves lesz, minden megváltozik. A családjával a békés kertvárosból kénytelenek San Franciscóba költözni, az édesapa új állása miatt. A költözés nem várt változásokat hoz Riley életébe, ami felkavarja az érzelmeit.
Többet nem is árulnánk el azoknak, akik még nem látták a filmet, helyette inkább nézzük meg az érzelmeket közelebbről is!
DerűRiley első számú és legmeghatározóbb érzelme, ő tölti be a vezető szerepet. A lány szüntelen jókedvéért és öröméért felel. Melegszívű, és mindenben meglátja a jót. Azonban, amikor Bánattal együtt elvesznek Riley elméjében, Derű fokozatosan átértékeli az addig helyesnek gondolt tevékenységeit, amelynek során nemcsak Riley, de az ő saját személyisége is fejlődik.
Bánat Riley szomorúsága. A többi érzelemmel ellentétben nehezen találja a szerepkörét Riley életében, és rosszul viseli, hogy negatív érzelemmel tölti el a kislányt. Amikor azonban ő és Derű véletlenül eltévednek, Derűhöz hasonlóan ő is jellemfejlődésen megy keresztül, és megtalálja a maga fontosságát a lány életében.
Harag a lány önbizalmát és becsületét védi. Azért felel, hogy Riley erős, magabiztos legyen, így temperamentumos, türelmetlen, és gyakran fel is robban mérgében. Derű és Bánat távollétében Harag, Undor és Majré együtt próbálják irányítani Rileyt, ami azonban nem kevés galibát okoz.
Undor igyekszik megóvni Rileyt a fizikai és lelki sérelmektől, éppen ezért önfejű, szókimondó, és néha kicsit bumfordi is. Viszont mindig a legjobb szándék vezérli Riley érdekében.
Majré feladata, hogy Riley biztonságát megóvja. Ennek okán pesszimista és aggályos, idejét pedig folyamatosan azzal tölti, hogy a katasztrófák, veszélyek lehetőségét elemzi a lány életében.
Mint Paul Ekman nagy rajongói, természetesen nem kellett sok idő a film beharangozója után, hogy hiányolni kezdjük a 6. alapérzelmet, a meglepetést. Docter, a rendező a következőt nyilatkozta ebben a vonatkozásban: Összesen 27 emóciótípust vettek számításba a jelenlegi tudományos eredmények alapján, azonban mind a 27 érzelem filmbeli szerepeltetését túl kaotikusnak találták volna, ezért végül Paul Ekman alapérzelmeire hagyatkoztak. Ugyanakkor, közülük is ki kellett hagyniuk a meglepetést, ugyanis Docter Majré karaktere mellett redundánsnak találta volna azt.
Bár értjük Docter gondolatmenetét, és azt is látjuk, hogy Majré mellé nagyon nehéz lett volna egy olyan karaktert rajzolni, aki a puszta meglepődést képviseli. Mégis sajnáljuk ezt a veszteséget, hiszen így csupán a negatív meglepődés képviselteti magát a mesében. A pozitív nem, vagy csak részben, Derű karakterén keresztül. Szerintünk egy folyton csodálkozó, ártatlan lelkű Meglepetéselfért volna még a vásznon. A retro meseillusztrációk alapján elképzeltük, milyen lenne, ha ő is szerepet kapott volna. Lássuk:
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
A QWERTY-hatás fogaloma először Daniel Casasanto & Kyle Jasmin munkájában jelenik meg. Röviden arról van szó, hogy mivel a QWERTY billentyűzet elrendezése aszimmetrikus, (Casasanto és Jasmin (a továbbiakban C&J) kutatásában “résztvevő” mindhárom nyelvben (angol, spanyol és holland) a bal oldalon több betű található, mint a jobbon) az olyan szó, melyben több a jobb oldalról származó betű, kellemesebb érzetet idéz elő az éppen gépelő személyben, mivel azon a térfelen kevesebb opció közül kell választani, ami gyorsabban és folyamatosabban megy, mint a bal oldalon, ahol több opció közül lehet (és kell) választani.
Régeni Anna írása
Vagyis C&J azt állítják, hogy a szavak valenciája és a betűk helyzete összefügg. Ez a hatás állításuk szerint a 60-as évek után létrejött szavaknál még hangsúlyozottabban jelenik meg.
Ennyit az elméletről.
Nem árt megjegyezni, hogy a cikkben szintén bebizonyított hatást arról, hogy az amerikai gyermekek névadását is befolyásolja ez a hatás, a Language Log blogon ízekre szedték.
Sőt, igazából az egész cikket és az egész QWERTY-hatást atomjaira bontották, gyakorlatilag minden mondatát megkérdőjelezték, az adatokat nagyjából ugyanazokon a korpuszokon újra megvizsgálták és statisztikailag elemezték. Ők nem találtak szignifikáns hatást, illetve nagyon sok érdekes dolgot vetettek fel, mint például: miért a 60-as évektől nézzük a névadási tendenciákat, lehetne szélesebb skálán is vizsgálni a jelenséget (amit a blogon meg is tesznek és kijön, hogy máskor is kirajzolódik a C&J által talált mintázat, ami ennek fényében lehet, hogy nem a QWERTY, hanem bizonyos nevek hypeolásának tudható be.)
Ugyanakkor a szerzők igyekeztek alapos munkát végezni, nekik szignifikánsan, másoknak nem szignifikánsan, de kijött a hatás, tehát úgy tűnik, van ott valami, ami megér egy vagy akár több misét is.
Ha nem is megyünk olyan messzire, hogy a QWERTY befolyásolná a névadási trendeket, az mégis elgondolkodtató, hogy amióta az internet megjelent és robbanásszerűen elterjedt, a kommunikációs csatorna az orális megnyilatkozásokon kívül a számítógép lett és ugyan a forrás még mindig ugyanaz, vagyis a gondolataink, a beviteli mód jelentősen megváltozott, de legalább is nem elhanyagolható hányada a billentyűzetre helyeződött át. Az, hogy ennek van-e hatása, igazából biztos. Az, hogy mire és milyen hatása van, nehezebb kérdés, de Casasanto és Jasmin munkájában szerintem épp az a rész izgalmas, amit a populáris média nem igazán emelt ki: hogy a billentyűzet valamilyen szinten formálja a szavak jelentését. Lehet, hogy ez a szemantikai jelentést módosító hatás csak árnyalatni és természetesen a szavak jelentéséből származó valencia, tehát a szó negatív vagy pozitív érzelmi/jelentésbeli töltete felülmúlja a QWERTY-hatás mértékét, mégis, ha ott van, érdekes.
Éppen ezért mi is készítettünk egy kísérletet, magyarra. A magyar billentyűzet azért különleges ennél a kérdésnél, mert megfordul az aszimmetria és a jobb oldalra kerül több betű, a balra kevesebb. Ha nekünk is kijön a különbség (ha gondolatnyi is), csak épp fordított irányban, akkor még egy bizonyíték fog amellett szólni, hogy a feltevés helyes és valóban a leosztás van hatással a fizikai és ezáltal a pszichológiai érzetre is, ami aztán kihat a betűkből formált szavak jelentésére is, akár olvasáskor, beszéd közben, vagy hallgatáskor. Ezek közül mi az olvasás útján kimutatható hatás meglétét teszteljük. A következő posztban ennek a kísérletnek az eredményeiről adunk hírt.
Addig is azoknak, akik mélyebben is szeretnének elmerülni a témában:
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.