Korábbi posztunkban a nyelv kisvilág tulajdonságaival foglalkoztunk, s elméláztunk azon hogy vajon a nyelvelsajátítás során hogyan alakulnak a szavak hálózatai. Most CHILDES adatbázis magyar korpuszain keresztül bele is tekinthetünk ebbe.
A fenti képek 17-36 hónapos gyermekek megnyilatkozásait tartalmazó korpuszokból készült teljes szógráfok.
Sajnos a korpuszt nem sikerült jól megtisztítani, ezért a szótövezés eredménye sem tökéletes. Egyes elemeket át tudtunk írni (pl. "ajutó" -> "autó"), de továbbra is rengeteg igazi gyereknyelvi forma maradt a szövegekbe. Ezért az alábbi táblázatban a korpusz nagyságát az egyedi "lexikai elemek" számával érzékeltetjük, mert szónak nem hívnánk minden elemét. Az adatot szolgáltató gyermekek korát hónapban adjuk meg. Fontos megjegyezni, hogy az adott korosztályokban eltérő számú beszélőtől származnak az adatok.
Kor (hónapban) | Lexikai elemek | Kapcsolatok |
17 | 12 | 20 |
19 | 20 | 42 |
20 | 936 | 4153 |
21 | 943 | 4181 |
22 | 1244 | 6620 |
23 | 1456 | 7590 |
24 | 1846 | 10343 |
25 | 2136 | 12306 |
26 | 2707 | 16877 |
27 | 3044 | 19288 |
28 | 3672 | 23496 |
29 | 3882 | 24957 |
30 | 3999 | 25654 |
31 | 4340 | 28420 |
32 | 4584 | 30058 |
33 | 5029 | 33213 |
34 | 5593 | 38550 |
35 | 6165 | 43975 |
36 | 6274 | 44842 |
Látható, hogy a lexikai elemek száma szépen egyenletesen nő, a kapcsolatok száma viszont gyorsabban, habár egy kicsit hullámozva. Az alábbi négy gráf a száz legmagasabb fokszámú csomópontot tartalmazza a 20, 25, 30 és 36 hónapos beszélők szövegeiből.
Érdekes, hogy a gráfok központi magjának alakulása. Kezdetben névmások és főnevek uralják a központi magot, s csak a 30-36 hónapos korban kezdenek megerősödni a funkciószavak.Ahogy a hálózat növekszik, azt tapasztaltuk, hogy egy-egy elem kitüntetett szerepet kap, az új elemek hozzájuk kapcsolódnak először. Ilyenek a funkciószavak és egyes főnevek.
Sajnos a CHILDES korpusz nem dúskál magyar adatokban, ami van, az sem a leghasználhatóbb. Az adatokkal játszani viszont nagyon jó volt!