Ma az NLP meetupon adunk elő egy Járókelőnek végzett projektünkről. Beszámolunk rögös utunkról, hogy hogyan jutottunk el a nyers adatoktól az annotáláson keresztül egy osztályozó modell építéséig, miközben olyan nehéz döntéseket kellett meghoznunk, minthogy megválunk egy annotátorunk eredményeitől.
Big Data - Keresés - Számítógépes nyelvészet - Szövegbányászat - Gépi tanulás - NLP Meetup - Precognox
A négyes annotátor kizárása
2017.03.22. 15:21 Szerző: meetup Precognox Járókelő
Címkék:A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre
Mind reading and Search @ d-kom Budapest
2017.03.09. 08:51 Szerző: konferencia search SAP Precognox d-kom
Címkék:Ma az SAP d-kom konferenciáján adunk elő. Mind Reading and Search című előadásunkban arra keressük a választ, hogy miképp lehet a keresés intelligens.
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre
De hol van Chewbacca? - Adatavizualizáció Meetup
2017.02.16. 16:03 Szerző: meetup adatvizualizáció Precognox
Címkék:Ma az Adatvizualizáció Meetupon adunk elő adatvizualizációs projektjeinkről. Megtudhatjátok, hogy mi hogyan bányászunk a szövegekben, miért kértünk külső segítséget Szűcs Kriszta adatvizualizációs gurutól és hogy milyen krízist tud okozni az adatos csapatban, ha eltűnik Chewbacca. Alább találjátok diáinkat és a kapcsolódó linkeket.
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre
Idei MSZNY-ünk - 2017
2017.02.15. 08:00 Szerző: konferencia tartalomelemzés szentiment Szeged szentimentelemzés emócióelemzés MSZNY
Címkék:Januárunk igen hasznosan és kellemesen zártuk Szegeden, a tizenharmadik alkalommal megrendezésre kerülő Magyar Számítógépes Nyelvészeti Konferencián. A Szegedi Tudományegyetem Informatikai Tanszékcsoportjának szervezésében az ország kutatói évről évre lehetőséget kapnak, hogy bemutassák a nyelvtechnológia területén végzett kutatásaikat és eredményeiket megismertessék a nagyközönséggel.
Az esemény fő célja az elvégzett vagy folyamatban lévő kutatások és fejlesztések legaktuálisabb eredményeinek bemutatása, de mindemellett lehetőséget ad hallgatói projektek, illetve a nyelvtechnológia ipari alkalmazásainak ismertetésére is. Az MSZNY szinte egyedüliként áll a hazai tudományos konferenciák között, ahol a számítógépes nyelvészeté a főszerep, ezért nem csak a kutatókat, de azokat is nagy számban vonzza, akik információt vagy betekintést szeretnének kapni a legújabb fejlesztésekről, vagy a hazai nyelvtechnológia helyzetéről.
Mi teljes gőzzel igyekeztünk az összes folyamatban lévő és bemutatott kutatás megismerésére, de természetesen nem felejtettük el magunkat jól érezni sem! És mivel tudományosan bizonyított tény, hogy mai vizuális világunkban az agyunk szívesebben fogad be vizuális anyagokat, élménybeszámolónkat képekkel is elláttuk.
A két naposra tervezett konferencián az idei évben igen sokszínű prezentációkat láttunk, melyek témája szintén széles skálán mozgott. A megnyitót követően egy irodalmár előadását hallgathattuk meg a filológia szerepéről az információs társadalomban, majd pedig az információkinyerés legaktuálisabb alkalmazásairól kaptunk ismertetőt.
A nap második felében az e-magyar szekción belül különböző elemző és szövegfeldolgozó eszközök fejlesztéseibe nyertünk bepillantást, majd egy kötelező kávészünet után a laptopos bemutatók világa varázsolt el minket, ami után pedig beszédtechnológiával zártuk a napot.
Az igazi megmérettetés a konferencia második napján várt minket, hiszen ekkor mutattuk be prezentációinkat és poszterünket. A szentiment szekció keretein belül két cikkünk, először Drávucz Fanni, Szabó Martina Katalin és Vincze Veronika szerzőségében a Szentiment- és emóciószótárak eredményességének mérése emóció- és szentimentkorpuszokon...
majd pedig Szabó Martina Katalin, Nyíri Zsófi, Morvay Gergely és Lázár Bernadett: A szentimentérték módosulásának vizsgálata szemantikai–pragmatikai szempontból annotált korpuszon cím alatt futó kutatásaink mai eredményeit vittük az érdeklődök elé.
Mivel ennyivel nem elégedtünk meg, poszterrel és laptopos bemutatóval is szórakoztattok a tisztelt közönséget, Balogh Kitti, Fülöp Nóra és Szabó Martina Katalin jóvoltából, akik A 2016-os tanártüntetések szövegeinek feldolgozása és adatvizualizációja interaktív dashboard segítségével elnevezésű projektjükkel mindkét szekcióban helyet kaptak.
Dashboardunk...
... és poszterünk.
Köszönjük mindenkinek, aki meghallgatott minket, teljes szívből reméljük, hogy jövőre ugyanitt, ugyanekkor találkozunk! Mi biztosan itt leszünk!
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre
Alkalmazott nyelvészeti doktorandusz konferencia - 2017, Beharangozó
2017.02.01. 08:00 Szerző: fordítás konferencia orosz nyelvészet gender alkalmazott nyelvészet korpuszok korpusznyelvészet NLP emócióelemzés szenitmentelemzés
Címkék:Örömmel tudatjuk, hogy az idei évben is megrendezésre kerülő XI. Alkalmazott Nyelvészeti Doktorandusz Konferencián (http://www.nytud.hu/alknyelvdok17/) a Precognox csapata is képviselteti magát.
A konferencia célja, hogy lehetőséget teremtsen az alkalmazott nyelvészet területén végzett magas szintű doktori kutatások bemutatására, a különböző témákban felmerülő kutatási kérdések és problémák megvitatására és a kutatók egymással, valamint a szakma többi képviselőjével folytatott tudományos kommunikációjának elősegítésére. Bízunk benne, hogy az elmúlt időszakban végzett kutatásaink színesítik majd az esemény palettáját és hozzájárulnak annak szívonalához. A konferencia ismételten a Magyar Tudományos Akadémia Nyelvtudományi Intézetében (1068, Budapest, Benczúr u. 33.) kerül megrendezésre február 3-án, ahol az alábbi előadásainkat hallgathatják meg az érdeklődők:
A 2. szekcióban (10:45 - 12:05):
- A negatív emotív elemek vizsgálata a nemek közötti nyelvhasználati különbségek szempontjából (Szabó Martina Katalin, Lázár Bernadett, Nyíri Zsófi és Morvay Gergely)
Az előadás a negatív emotív szemantikai tartalmú elemeket vizsgálja egy magyar nyelvű twitter-korpuszban, a női és férfi nyelvhasználati különbségekre fókuszálva. A vizsgálat előtt azt feltételeztük, hogy a negatív emotív elemek használatában jelentős nemek közötti eltérést fogunk tapasztalni, és az eltérés több szinten is számottevő lesz. Másképpen, a férfiak és a nők nem azonos gyakorisággal élnek a vizsgált kifejezésekkel fokozó elem, valamint szentimentkifejezés funkciójában, továbbá nem azonos gyakorisággal használják az egyes elemeket sem. Ízelítőként közzétesszük két kördiagrammunkat!
A nők korpuszában előforduló fokozó szerepű elemek gyakorisági megoszlása:
A férfiak korpuszában előforduló fokozó szerepű elemek gyakorisági megoszlása:
Hogy a vizsgálódásaink során beigazolódtak-e hipotéziseink, és amennyiben igen, akkor melyik nemnek milyen fokozó szavak használata tűnik csábítóbbnak, azt a konferencián megtudhatják!
A 3. szekcióban (14:00 - 15:20):
- A beszélői szubjektivitás vizsgálata szentiment- és emóciókorpuszokon (Szabó Martina Katalin, Drávucz Fanni)
- Negatív emotív szemantikai tartalmú fokozó elemek vizsgálata az angol–orosz és orosz–angol fordítás tükrében (Szabó Martina Katalin, Nyíri Zsófi és Lázár Bernadett)
Az elsőként bemutatandó kutatásunk alapját egy korábbi elemzésünk képezi, amely során szentimentszótárak segítségével emóciókorpuszt, és emóciószótárak segítségével szentimentkorpuszt vizsgáltunk. Megállapítottuk, hogy a szentimentkorpuszunkban annotált szentimenteknek csupán negyede volt jelezhető az emóciószótárainkkal. E tapasztalat alapján úgy döntöttünk, megvizsgáljuk, vajon a szentimentek, az emóciók, valamint a beszélői szubjektivitás milyen összefüggései tárhatóak fel automatikus eszközökkel. A konferencián bővebben ismertetjük az elemzésre általunk kiválasztott módszert, és természetesen a kapott eredményeket is.
A negatív emótív szemantikai tartalmú fokozó elemekkel való ismeretségünk sem érhet véget, ezúttal azokat angolról oroszra és oroszról angolra történő fordítás szempontjából vizsgáltuk meg. Előadásunkat több szempontból is hiánypótlónak tekintjük, hiszen nincs tudomásunk más olyan dolgozatról, amely a negatív emotív fokozó elemeket a fordítási műveletek, illetve lehetőségek szempontjából vizsgálat tárgyává tenné. Mi ezt most megtettük, és ha elsőkézből az elsők között kíván a részletes, korpuszból származó példák segítségével reprezentált és alátámasztott eredményekkel megismerkedni, örömmel látjuk pénteki prezentációnkon!
Amennyiben előadásaink rövid ismeretetői felkeltették érdeklődésüket, jöjjenek el Önök is, találkozzunk a XI. Alkalmazott Nyelvészeti Doktorandusz Konferencián február 3-án pénteken!
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.