A SZTAKI Nyelvtechnológiai Kutatócsoportja idén is izgalmas programmal várja az érdeklődőket a Kutatók Éjszakáján. A részvétel ingyenes, de előzetes regisztrációhoz kötött.
Gondolkoztál már azon, hogy hogyan készülnek a szótárak? Te hogy fognál hozzá pl. egy örmény-finn szótár építéséhez? A SZTAKI Nyelvtechnológiai csoportja több módszert is bemutat szótárak automatikus készítésére.
A bemutatott eljárások egy része a Wikipediához hasonlóan közösség által épített Wiktionary-t használja kiindulási alapként, a többi pedig statisztikai módszerekkel nyer ki fordításokat különböző nyelvű szövegpárokból. A szótárépítést élőben is figyelemmel követhetik az érdeklődők.
Észrevetted már, hogy a böngésző felismeri a weboldalak nyelvét? Vagy a Google Translate kitalálja, hogy milyen nyelvű szót írtál be? Elegendő egy hosszú lista az adott nyelv szavairól? Sajnos ez a lista sosem lehet teljes, mindig találnánk új és új szavakat. Míg a szótárak épülnek, bemutatunk néhány egyszerű módszert, amikkel nem szükséges szavak millióit számon tartanunk. A nyelvfelismerőnket élőben is ki lehet próbálni.