HTML

Precognox

precognox_logo_190.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati és big data megoldásokat.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Facebook oldaldoboz

Meetup ajánló

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Az opendata.hu oldalt a Magyar OpenData Alapítvány/Egyesület hivatalos megalakulásáig - lelkes önkéntesek segítségével a
K-Monitor Közhasznú Egyesület (K-Monitor) működteti, az üzemeltetést a Precognox végzi.

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

A négyes annotátor kizárása

2017.03.22. 15:21 Szerző: kittibalogh Címkék: meetup Precognox Járókelő

Ma az NLP meetupon adunk elő egy Járókelőnek végzett projektünkről. Beszámolunk rögös utunkról, hogy hogyan jutottunk el a nyers adatoktól az annotáláson keresztül egy osztályozó modell építéséig, miközben olyan nehéz döntéseket kellett meghoznunk, minthogy megválunk egy annotátorunk eredményeitől.

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Mind reading and Search @ d-kom Budapest

2017.03.09. 08:51 Szerző: zoltanvarju Címkék: konferencia search SAP Precognox d-kom

Ma az SAP d-kom konferenciáján adunk elő. Mind Reading and Search című előadásunkban arra keressük a választ, hogy miképp lehet a keresés intelligens.

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

De hol van Chewbacca? - Adatavizualizáció Meetup

2017.02.16. 16:03 Szerző: kittibalogh Címkék: meetup adatvizualizáció Precognox

Ma az Adatvizualizáció Meetupon adunk elő adatvizualizációs projektjeinkről. Megtudhatjátok, hogy mi hogyan bányászunk a szövegekben, miért kértünk külső segítséget Szűcs Kriszta adatvizualizációs gurutól és hogy milyen krízist tud okozni az adatos csapatban, ha eltűnik Chewbacca. Alább találjátok diáinkat és a kapcsolódó linkeket.

 

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Idei MSZNY-ünk - 2017

2017.02.15. 08:00 Szerző: nyirizsofi Címkék: konferencia tartalomelemzés szentiment Szeged szentimentelemzés emócióelemzés MSZNY

Januárunk igen hasznosan és kellemesen zártuk Szegeden, a tizenharmadik alkalommal megrendezésre kerülő Magyar Számítógépes Nyelvészeti Konferencián. A Szegedi Tudományegyetem Informatikai Tanszékcsoportjának szervezésében az ország kutatói évről évre lehetőséget kapnak, hogy bemutassák a nyelvtechnológia területén végzett kutatásaikat és eredményeiket megismertessék a nagyközönséggel.

Az esemény fő célja az elvégzett vagy folyamatban lévő kutatások és fejlesztések legaktuálisabb eredményeinek bemutatása, de mindemellett lehetőséget ad hallgatói projektek, illetve a nyelvtechnológia ipari alkalmazásainak ismertetésére is. Az MSZNY szinte egyedüliként áll a hazai tudományos konferenciák között, ahol a számítógépes nyelvészeté a főszerep, ezért nem csak a kutatókat, de azokat is nagy számban vonzza, akik információt vagy betekintést szeretnének kapni a legújabb fejlesztésekről, vagy a hazai nyelvtechnológia helyzetéről.

Mi teljes gőzzel igyekeztünk az összes folyamatban lévő és bemutatott kutatás megismerésére, de természetesen nem felejtettük el magunkat jól érezni sem! És mivel tudományosan bizonyított tény, hogy mai vizuális világunkban az agyunk szívesebben fogad be vizuális anyagokat, élménybeszámolónkat képekkel is elláttuk.

20170127_162357.jpg

A két naposra tervezett konferencián az idei évben igen sokszínű prezentációkat láttunk, melyek témája szintén széles skálán mozgott. A megnyitót követően egy irodalmár előadását hallgathattuk meg a filológia szerepéről az információs társadalomban, majd pedig az információkinyerés legaktuálisabb alkalmazásairól kaptunk ismertetőt.

20170127_162716.jpg

A nap második felében az e-magyar szekción belül különböző elemző és szövegfeldolgozó eszközök fejlesztéseibe nyertünk bepillantást, majd egy kötelező kávészünet után a laptopos bemutatók világa varázsolt el minket, ami után pedig beszédtechnológiával zártuk a napot.

20170127_162637.jpg

Az igazi megmérettetés a konferencia második napján várt minket, hiszen ekkor mutattuk be prezentációinkat és poszterünket. A szentiment szekció keretein belül két cikkünk, először Drávucz Fanni, Szabó Martina Katalin és Vincze Veronika szerzőségében a  Szentiment- és emóciószótárak eredményességének mérése emóció- és szentimentkorpuszokon...

20170127_112251.jpg

majd pedig Szabó Martina Katalin, Nyíri Zsófi, Morvay Gergely és Lázár Bernadett: A szentimentérték módosulásának vizsgálata szemantikai–pragmatikai szempontból annotált korpuszon cím alatt futó kutatásaink mai eredményeit vittük az érdeklődök elé.

wp_20170127_001.jpg

Mivel ennyivel nem elégedtünk meg, poszterrel és laptopos bemutatóval is szórakoztattok a tisztelt közönséget, Balogh Kitti, Fülöp Nóra és Szabó Martina Katalin jóvoltából, akik A 2016-os tanártüntetések szövegeinek feldolgozása és adatvizualizációja interaktív dashboard segítségével elnevezésű projektjükkel mindkét szekcióban helyet kaptak.

Dashboardunk...

16427602_10208208801085487_1506758381796825059_n.jpg

... és poszterünk.

wp_20170127_002.jpg

Köszönjük mindenkinek, aki meghallgatott minket, teljes szívből reméljük, hogy jövőre ugyanitt, ugyanekkor találkozunk! Mi biztosan itt leszünk!

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Alkalmazott nyelvészeti doktorandusz konferencia - 2017, Beharangozó

2017.02.01. 08:00 Szerző: nyirizsofi Címkék: fordítás konferencia orosz nyelvészet gender alkalmazott nyelvészet korpuszok korpusznyelvészet NLP emócióelemzés szenitmentelemzés

Örömmel tudatjuk, hogy az idei évben is megrendezésre kerülő XI. Alkalmazott Nyelvészeti Doktorandusz Konferencián (http://www.nytud.hu/alknyelvdok17/) a Precognox csapata is képviselteti magát.

A konferencia célja, hogy lehetőséget teremtsen az alkalmazott nyelvészet területén végzett magas szintű doktori kutatások bemutatására, a különböző témákban felmerülő kutatási kérdések és problémák megvitatására és a kutatók egymással, valamint a szakma többi képviselőjével folytatott tudományos kommunikációjának elősegítésére. Bízunk benne, hogy az elmúlt időszakban végzett kutatásaink színesítik majd az esemény palettáját és hozzájárulnak annak szívonalához. A konferencia ismételten a Magyar Tudományos Akadémia Nyelvtudományi Intézetében (1068,  Budapest, Benczúr u. 33.) kerül megrendezésre február 3-án, ahol az alábbi előadásainkat hallgathatják meg az érdeklődők:

A 2. szekcióban (10:45 - 12:05): 

  • A negatív emotív elemek vizsgálata a nemek közötti nyelvhasználati különbségek szempontjából (Szabó Martina Katalin, Lázár Bernadett, Nyíri Zsófi és Morvay Gergely)

Az előadás a negatív emotív szemantikai tartalmú elemeket vizsgálja egy magyar nyelvű twitter-korpuszban, a női és férfi nyelvhasználati különbségekre fókuszálva. A vizsgálat előtt azt feltételeztük, hogy a negatív emotív elemek használatában jelentős nemek közötti eltérést fogunk tapasztalni, és az eltérés több szinten is számottevő lesz. Másképpen, a férfiak és a nők nem azonos gyakorisággal élnek a vizsgált kifejezésekkel fokozó elem, valamint szentimentkifejezés funkciójában, továbbá nem azonos gyakorisággal használják az egyes elemeket sem. Ízelítőként közzétesszük két kördiagrammunkat!

A nők korpuszában előforduló fokozó szerepű elemek gyakorisági megoszlása:

diag1.jpg

 

A férfiak korpuszában előforduló fokozó szerepű elemek gyakorisági megoszlása:

diag3.jpg

 

Hogy a vizsgálódásaink során beigazolódtak-e hipotéziseink, és amennyiben igen, akkor melyik nemnek milyen fokozó szavak használata tűnik csábítóbbnak, azt a konferencián megtudhatják!

A 3. szekcióban (14:00 - 15:20):

  • A beszélői szubjektivitás vizsgálata szentiment- és emóciókorpuszokon (Szabó Martina Katalin, Drávucz Fanni)
  • Negatív emotív szemantikai tartalmú fokozó elemek vizsgálata az angol–orosz és orosz–angol fordítás tükrében (Szabó Martina Katalin, Nyíri Zsófi és Lázár Bernadett)

Az elsőként bemutatandó kutatásunk alapját egy korábbi elemzésünk képezi, amely során szentimentszótárak segítségével emóciókorpuszt, és emóciószótárak segítségével szentimentkorpuszt vizsgáltunk. Megállapítottuk, hogy a szentimentkorpuszunkban annotált szentimenteknek csupán negyede volt jelezhető az emóciószótárainkkal. E tapasztalat alapján úgy döntöttünk, megvizsgáljuk, vajon a szentimentek, az emóciók, valamint a beszélői szubjektivitás milyen összefüggései tárhatóak fel automatikus eszközökkel. A konferencián bővebben ismertetjük az elemzésre általunk kiválasztott módszert, és természetesen a kapott eredményeket is. 

A negatív emótív szemantikai tartalmú fokozó elemekkel való ismeretségünk sem érhet véget, ezúttal azokat angolról oroszra és oroszról angolra történő fordítás szempontjából vizsgáltuk meg. Előadásunkat több szempontból is hiánypótlónak tekintjük, hiszen nincs tudomásunk más olyan dolgozatról, amely a negatív emotív fokozó elemeket a fordítási műveletek, illetve lehetőségek szempontjából vizsgálat tárgyává tenné. Mi ezt most megtettük, és ha elsőkézből az elsők között kíván a részletes, korpuszból származó példák segítségével reprezentált és alátámasztott eredményekkel megismerkedni, örömmel látjuk pénteki prezentációnkon!

Amennyiben előadásaink rövid ismeretetői felkeltették érdeklődésüket, jöjjenek el Önök is, találkozzunk a XI. Alkalmazott Nyelvészeti Doktorandusz Konferencián február 3-án pénteken!

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre