Előző posztunk kapcsán többen jelezték, hogy nem látszik túl jól, miképp növekszik a gyermekek szótára a hónapok során. A megoldást továbbra sem tudjuk, de most két gráfot közlünk, ami talán segít jobban bemutatni a jelenséget. A gráfban minden kapcsolat megtalálható a 17-36 hónapos beszélőktől származó szövegekből. Mindkét gráfon 140 csomópont látható, fokszámuk 84 és 2469 között van. A két gráf megegyezik, azaz ugyanaz az egyes elemek helye, nagysága és színe a két képen. A különbség a címkékben van, az elsőn a számok azt jelentik, hogy az adott lexikai elem hány hónapos beszélőnél jelent meg először a korpuszban, a második képen pedig a csomópontokhoz tartozó szavak láthatóak.
Big Data - Keresés - Számítógépes nyelvészet - Szövegbányászat - Gépi tanulás - NLP Meetup - Precognox
Bababeszéd és gráfok 2.
2015.06.08. 13:04 Szerző: nyelvészet nyelv kisvilág korpusznyelvészet
Címkék:A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre
A bejegyzés trackback címe:
Kommentek:
A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben és az adatvédelmi tájékoztatóban.