Hol fordulnak elő egy szövegben bizonyos szavak? Hogyan változik használatuk időben? Hogyan lehet összevetni egy-egy szó használatát egy adott korpuszon belül? A legtöbben egy egyszerű idősort képeznének az adatokból, de a korpusznyelvészek erre fejlesztették ki a konkordancia plotot, ami igazából a DNS-ujjlenyomat megjelenítésével lett ismert vizualizációs technika. Interaktív konkordancia plotunkkal Orbán Viktor 1999 és 2015 közötti évértékelő beszédeit lehet felfedezni, reméljük hozzánk hasonlóan sokat fognak olvasóink is szórakozni egy-egy szó használati gyakoriságának változásán.
A konkordancia plotok először az ötvenes években váltak népszerűvé, majd az egyszerű, de komoly követői bázist kiépítő AntConc korpusznyelvészeti szoftver terjesztette el. Ahogy az alábbi példa is mutatja, egy funkcionálisan egyszerű plotról beszélünk, ami azonban nagyon hasznosnak bizonyult a kutatók számára.
Az elektroforézises DNS-ujjlenyomat megjelenítésére is hasonló technikát alkalmaznak, ami nem olyan nagy csoda, hiszen a DNS szekvenciák feldolgozása nagyon hasonlít a számítógépes nyelvészeti feladatokhoz. Vizualizációnkhoz is egy erre a területre készített D3 plugint használtunk, amit nagyon minimálisan módosítottunk csak.
- Interaktív konkordancia plot Orbán Viktor évértékelő beszédeire (1999-2015)
- A nyest.hu-val készített Orbán Viktor beszédeit és parlamenti felszólalásait tartalmazó korpuszunk felhasználásával készült cikkeket olvashatsz itt és itt
- Az Orbán Viktor évértékelő beszédeiből készített korpuszunkkal ebben a korábbi posztunkban részletesebben is foglalkoztunk.