HTML

Precognox

precognox_logo_190.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati és big data megoldásokat.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Facebook oldaldoboz

Meetup ajánló

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Az opendata.hu oldalt a Magyar OpenData Alapítvány/Egyesület hivatalos megalakulásáig - lelkes önkéntesek segítségével a
K-Monitor Közhasznú Egyesület (K-Monitor) működteti, az üzemeltetést a Precognox végzi.

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

De hol van Chewbacca? - Adatavizualizáció Meetup

2017.02.16. 16:03 Szerző: kittibalogh Címkék: meetup adatvizualizáció Precognox

Ma az Adatvizualizáció Meetupon adunk elő adatvizualizációs projektjeinkről. Megtudhatjátok, hogy mi hogyan bányászunk a szövegekben, miért kértünk külső segítséget Szűcs Kriszta adatvizualizációs gurutól és hogy milyen krízist tud okozni az adatos csapatban, ha eltűnik Chewbacca. Alább találjátok diáinkat és a kapcsolódó linkeket.

 

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Idei MSZNY-ünk - 2017

2017.02.15. 08:00 Szerző: nyirizsofi Címkék: konferencia tartalomelemzés szentiment Szeged szentimentelemzés emócióelemzés MSZNY

Januárunk igen hasznosan és kellemesen zártuk Szegeden, a tizenharmadik alkalommal megrendezésre kerülő Magyar Számítógépes Nyelvészeti Konferencián. A Szegedi Tudományegyetem Informatikai Tanszékcsoportjának szervezésében az ország kutatói évről évre lehetőséget kapnak, hogy bemutassák a nyelvtechnológia területén végzett kutatásaikat és eredményeiket megismertessék a nagyközönséggel.

Az esemény fő célja az elvégzett vagy folyamatban lévő kutatások és fejlesztések legaktuálisabb eredményeinek bemutatása, de mindemellett lehetőséget ad hallgatói projektek, illetve a nyelvtechnológia ipari alkalmazásainak ismertetésére is. Az MSZNY szinte egyedüliként áll a hazai tudományos konferenciák között, ahol a számítógépes nyelvészeté a főszerep, ezért nem csak a kutatókat, de azokat is nagy számban vonzza, akik információt vagy betekintést szeretnének kapni a legújabb fejlesztésekről, vagy a hazai nyelvtechnológia helyzetéről.

Mi teljes gőzzel igyekeztünk az összes folyamatban lévő és bemutatott kutatás megismerésére, de természetesen nem felejtettük el magunkat jól érezni sem! És mivel tudományosan bizonyított tény, hogy mai vizuális világunkban az agyunk szívesebben fogad be vizuális anyagokat, élménybeszámolónkat képekkel is elláttuk.

20170127_162357.jpg

A két naposra tervezett konferencián az idei évben igen sokszínű prezentációkat láttunk, melyek témája szintén széles skálán mozgott. A megnyitót követően egy irodalmár előadását hallgathattuk meg a filológia szerepéről az információs társadalomban, majd pedig az információkinyerés legaktuálisabb alkalmazásairól kaptunk ismertetőt.

20170127_162716.jpg

A nap második felében az e-magyar szekción belül különböző elemző és szövegfeldolgozó eszközök fejlesztéseibe nyertünk bepillantást, majd egy kötelező kávészünet után a laptopos bemutatók világa varázsolt el minket, ami után pedig beszédtechnológiával zártuk a napot.

20170127_162637.jpg

Az igazi megmérettetés a konferencia második napján várt minket, hiszen ekkor mutattuk be prezentációinkat és poszterünket. A szentiment szekció keretein belül két cikkünk, először Drávucz Fanni, Szabó Martina Katalin és Vincze Veronika szerzőségében a  Szentiment- és emóciószótárak eredményességének mérése emóció- és szentimentkorpuszokon...

20170127_112251.jpg

majd pedig Szabó Martina Katalin, Nyíri Zsófi, Morvay Gergely és Lázár Bernadett: A szentimentérték módosulásának vizsgálata szemantikai–pragmatikai szempontból annotált korpuszon cím alatt futó kutatásaink mai eredményeit vittük az érdeklődök elé.

wp_20170127_001.jpg

Mivel ennyivel nem elégedtünk meg, poszterrel és laptopos bemutatóval is szórakoztattok a tisztelt közönséget, Balogh Kitti, Fülöp Nóra és Szabó Martina Katalin jóvoltából, akik A 2016-os tanártüntetések szövegeinek feldolgozása és adatvizualizációja interaktív dashboard segítségével elnevezésű projektjükkel mindkét szekcióban helyet kaptak.

Dashboardunk...

16427602_10208208801085487_1506758381796825059_n.jpg

... és poszterünk.

wp_20170127_002.jpg

Köszönjük mindenkinek, aki meghallgatott minket, teljes szívből reméljük, hogy jövőre ugyanitt, ugyanekkor találkozunk! Mi biztosan itt leszünk!

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Alkalmazott nyelvészeti doktorandusz konferencia - 2017, Beharangozó

2017.02.01. 08:00 Szerző: nyirizsofi Címkék: fordítás konferencia orosz nyelvészet gender alkalmazott nyelvészet korpuszok korpusznyelvészet NLP emócióelemzés szenitmentelemzés

Örömmel tudatjuk, hogy az idei évben is megrendezésre kerülő XI. Alkalmazott Nyelvészeti Doktorandusz Konferencián (http://www.nytud.hu/alknyelvdok17/) a Precognox csapata is képviselteti magát.

A konferencia célja, hogy lehetőséget teremtsen az alkalmazott nyelvészet területén végzett magas szintű doktori kutatások bemutatására, a különböző témákban felmerülő kutatási kérdések és problémák megvitatására és a kutatók egymással, valamint a szakma többi képviselőjével folytatott tudományos kommunikációjának elősegítésére. Bízunk benne, hogy az elmúlt időszakban végzett kutatásaink színesítik majd az esemény palettáját és hozzájárulnak annak szívonalához. A konferencia ismételten a Magyar Tudományos Akadémia Nyelvtudományi Intézetében (1068,  Budapest, Benczúr u. 33.) kerül megrendezésre február 3-án, ahol az alábbi előadásainkat hallgathatják meg az érdeklődők:

A 2. szekcióban (10:45 - 12:05): 

  • A negatív emotív elemek vizsgálata a nemek közötti nyelvhasználati különbségek szempontjából (Szabó Martina Katalin, Lázár Bernadett, Nyíri Zsófi és Morvay Gergely)

Az előadás a negatív emotív szemantikai tartalmú elemeket vizsgálja egy magyar nyelvű twitter-korpuszban, a női és férfi nyelvhasználati különbségekre fókuszálva. A vizsgálat előtt azt feltételeztük, hogy a negatív emotív elemek használatában jelentős nemek közötti eltérést fogunk tapasztalni, és az eltérés több szinten is számottevő lesz. Másképpen, a férfiak és a nők nem azonos gyakorisággal élnek a vizsgált kifejezésekkel fokozó elem, valamint szentimentkifejezés funkciójában, továbbá nem azonos gyakorisággal használják az egyes elemeket sem. Ízelítőként közzétesszük két kördiagrammunkat!

A nők korpuszában előforduló fokozó szerepű elemek gyakorisági megoszlása:

diag1.jpg

 

A férfiak korpuszában előforduló fokozó szerepű elemek gyakorisági megoszlása:

diag3.jpg

 

Hogy a vizsgálódásaink során beigazolódtak-e hipotéziseink, és amennyiben igen, akkor melyik nemnek milyen fokozó szavak használata tűnik csábítóbbnak, azt a konferencián megtudhatják!

A 3. szekcióban (14:00 - 15:20):

  • A beszélői szubjektivitás vizsgálata szentiment- és emóciókorpuszokon (Szabó Martina Katalin, Drávucz Fanni)
  • Negatív emotív szemantikai tartalmú fokozó elemek vizsgálata az angol–orosz és orosz–angol fordítás tükrében (Szabó Martina Katalin, Nyíri Zsófi és Lázár Bernadett)

Az elsőként bemutatandó kutatásunk alapját egy korábbi elemzésünk képezi, amely során szentimentszótárak segítségével emóciókorpuszt, és emóciószótárak segítségével szentimentkorpuszt vizsgáltunk. Megállapítottuk, hogy a szentimentkorpuszunkban annotált szentimenteknek csupán negyede volt jelezhető az emóciószótárainkkal. E tapasztalat alapján úgy döntöttünk, megvizsgáljuk, vajon a szentimentek, az emóciók, valamint a beszélői szubjektivitás milyen összefüggései tárhatóak fel automatikus eszközökkel. A konferencián bővebben ismertetjük az elemzésre általunk kiválasztott módszert, és természetesen a kapott eredményeket is. 

A negatív emótív szemantikai tartalmú fokozó elemekkel való ismeretségünk sem érhet véget, ezúttal azokat angolról oroszra és oroszról angolra történő fordítás szempontjából vizsgáltuk meg. Előadásunkat több szempontból is hiánypótlónak tekintjük, hiszen nincs tudomásunk más olyan dolgozatról, amely a negatív emotív fokozó elemeket a fordítási műveletek, illetve lehetőségek szempontjából vizsgálat tárgyává tenné. Mi ezt most megtettük, és ha elsőkézből az elsők között kíván a részletes, korpuszból származó példák segítségével reprezentált és alátámasztott eredményekkel megismerkedni, örömmel látjuk pénteki prezentációnkon!

Amennyiben előadásaink rövid ismeretetői felkeltették érdeklődésüket, jöjjenek el Önök is, találkozzunk a XI. Alkalmazott Nyelvészeti Doktorandusz Konferencián február 3-án pénteken!

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

MSZNY - 2017, BEHARANGOZÓ

2017.01.25. 22:26 Szerző: nyirizsofi Címkék: konferencia dashboard NLP szentimentelemzés emócióelemzés MSZNY

 

Nagy örömmel és izgalommal tudatjuk, hogy a 2017. január 26-27-én, Szegeden megrendezésre kerülő XIII. Magyar Számítógépes Nyelvészeti Konferencián (MSZNY) három előadással is képviseljük magunkat.

 

Lehetőségünk nyílik bemutatni új eredményeinket a szentiment- és emócióelemzés terén, illetve poszterként reprezentálni egy szövegfeldolgozási projektünk audiovizualizációját interaktív dashboard segítségével. Folyamatos munkánk és kutatásaink során számtalan érdekes, és mindenekelőtt nyelvészeti szempontból fontos problémába ütközünk, amiket ezúttal szeretnénk megvitatni a konferencián résztvevő szakmai csoporttal és érdeklődökkel. Az MSZNY konferenciának idén is a Szegedi Tudományegyetem József Attila Tanulmányi és Információs Központja (TIK) ad otthont (Cím: 6722 Szeged, Ady tér 10.), ahol január 27-én, a következő időpontokban, a következő prezentációkkal találkozhattok velünk:

 

11:20 - Drávucz Fanni, Szabó Martina Katalin, Vincze Veronika: Szentiment- és emóciószótárak eredményességének mérése emóció- és szentimentkorpuszon

12:00 - Szabó Martina Katalin, Nyíri Zsófi, Morvay Gergely, Lázár Bernadett: A szentimentérték módosulásának vizsgálata szemantikai-pragmarikai szempontból annotált korpuszon

14:20 és 15:40 - Balogh Kitti, Fülöp Nóra, Szabó Martina Katalin: A 2016-os tanártüntetések szövegeinek feldolgozása és adatvizualizációja interaktív dashboard segítségével

Előadásaink egy-egy rövid ismertetőjével szeretnénk figyelmükbe ajánlani prezentációinkat:

 

Mivel az elmúlt időszakban nagyon szentimentálisak és emocionálisak voltunk, ezért két cikkünk is született a szentiment - és emócióelemzés témakörében. Egyrészről egy kézzel annotált korpuszon vizsgáltuk meg az emotív szemantikai tartalmú elemek egy speciális csoportját, a negatív emótív szemantikai tartalmú elemeket, másrészről pedig egy, szintén kézzel annotált, szentiment- és emóciókorpuszt elemeztünk, előbbit két különböző kategóriaszámú emóciószótárral, utóbbit pedig egy szentimentszótár segítségével. A szentimentérték módosulásával magyar nyelvű twitter-bejegyzések és az online elérhető annotáló program, a Brat segítségével kerültünk közelebbi kapcsolatba, míg a szentiment- és emócószótárak eredményességét a korpusz annotációja és a szótáras elemzés tapasztalatainak összevetése után tártuk fel. Bízunk benne, hogy bemutatott eredményeink, illetve a munka folyamatának és körülményeinek ismertetése, hozzásegíthet a vizsgált elemcsoport automatikus feldolgozásának fejlesztéséhez.

Természetesen mi sem maradhattunk ki a tavalyi tanártüntetésekből, és, habár csak vizuálisan, de az események mélyére ástuk magunkat! A 2016. Februári és márciusi történésekkel kapcsolatos posztokból és kommentekből létrehozott korpuszon végrehajtottunk egy automatikus emóció- és szentimentelemzést, majd pedig topik modellezéssel témákat nyertünk ki belőle. Az így kapott szemantikai adatokat vizualizáltuk egy interaktív dashboard segítségével, amit az MSZNY konferencián is bemutatunk!

kep1_6.png

kep2.png

 

Minden érdeklődöt szeretettel várunk, és köszönjük ha visszajelzésével segíti munkánkat. Találkozzunk január 26-27-én, Szegeden, az XIII. MSZNY konferencián!

http://rgai.inf.u-szeged.hu/index.php?lang=hu&page=mszny2017

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A multimodális keresés és tartalomelemzés lehetőségei @ conTEXT 2016

2016.11.29. 10:30 Szerző: zoltanvarju Címkék: keresés tartalomelemzés képfeldolgozás conTEXT

Ma a Clementine által szervezett conTEXT konferencián adunk elő multimodális tartalomelemzési kísérleteinkről. Ha nem tudtok eljönni, akkor ajánljuk a nyesten megjelent cikkünket a témában. Arról fogunk beszélni, hogy lehet a topik modellezést akár képekre is alkalmazni és ilyen szép kollázson megmutatni az eredményt:

hatarnal-keritesnel-uton-vizen.jpg

Varjú Zoltán: Van képünk hozzá! A multimodális keresés és tartalomelemzés lehetőségei

A keresés és a tartalomelemzés hagyományosan szövegekkel szeret foglalkozni, miközben az internetes tartalmak egyre inkább multimodálisak; szövegek, képek, videók és hanganyagok keverékei. Előadásunkban arra keressük a választ, hogy lehet-e egységes keretben reprezentálni a különféle modalitásokat. Egy gyakorlati példán keresztül pedig bemutatjuk, miképp vontuk be a hírelemzésbe a cikkekben szereplő képeket.

 

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre