A névvel rendelkező entitások felismerése (named entity recogniton, röviden NER) napjainkban a szövegfeldolgozás egyik kedvelt területe. Fodor Mánuel gyakornokunk egy egyszerű, általános célú NER rendszer kifejlesztésébe kapcsolódott be miután elkészítette beszédfelismerős cégkeresőnk prototípusát.
Az Entity Extractor demo felületén egy url-t adhatunk meg.
Az eszköz Text Extractor alkalmazásunkat használva képes az adott honlapon azonosítani a "törzsszöveget".
Jelenleg kb. 80%-os pontossággal képes azonosítani a szövegben szereplő entitásokat (személyek, szervezetek, helyek és egyéb kategóriákba sorolva).
A fejlesztés célja, hogy tovább növeljük az eszköz hatékonyságát, ill. szeretnénk az entitások közötti kapcsolatokat is felismerni.
Az Entity Extractor jelenleg még nem érhető el szabadon, de kérésre nagyon szívesen megmutatjuk működés közben is.
Ha jövő nyáron te is szívesen lennél gyakornok a Precognoxnál, jelentkezz már most! Maximum három személyt tudunk fogadni.