HTML

Precognox

precognox_logo_190.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati és big data megoldásokat.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Facebook oldaldoboz

Meetup ajánló

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Az opendata.hu oldalt a Magyar OpenData Alapítvány/Egyesület hivatalos megalakulásáig - lelkes önkéntesek segítségével a
K-Monitor Közhasznú Egyesület (K-Monitor) működteti, az üzemeltetést a Precognox végzi.

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

A multimodális keresés és tartalomelemzés lehetőségei @ conTEXT 2016

2016.11.29. 10:30 Szerző: zoltanvarju Címkék: keresés tartalomelemzés képfeldolgozás conTEXT

Ma a Clementine által szervezett conTEXT konferencián adunk elő multimodális tartalomelemzési kísérleteinkről. Ha nem tudtok eljönni, akkor ajánljuk a nyesten megjelent cikkünket a témában. Arról fogunk beszélni, hogy lehet a topik modellezést akár képekre is alkalmazni és ilyen szép kollázson megmutatni az eredményt:

hatarnal-keritesnel-uton-vizen.jpg

Varjú Zoltán: Van képünk hozzá! A multimodális keresés és tartalomelemzés lehetőségei

A keresés és a tartalomelemzés hagyományosan szövegekkel szeret foglalkozni, miközben az internetes tartalmak egyre inkább multimodálisak; szövegek, képek, videók és hanganyagok keverékei. Előadásunkban arra keressük a választ, hogy lehet-e egységes keretben reprezentálni a különféle modalitásokat. Egy gyakorlati példán keresztül pedig bemutatjuk, miképp vontuk be a hírelemzésbe a cikkekben szereplő képeket.

 

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Precognox @ YSM 2016

2016.11.04. 07:09 Szerző: kittibalogh Címkék: roma tartalomelemzés dashboard LDA

Ezen a hétvégén a Young Statistican Meeting-en adunk elő dashboardjainkról, topik modellekről és tartalomelemzésről. Alább megtalálható előadásunk absztrakja és a kapcsolódó diák.

 kip.png

Kitti Balogh: Unveiling latent topic structure in anti-Roma discourse using Latent Dirichlet Allocation 

From the mid 2000's the number of anti-Roma and racist utterances have been increasing in Hungary and this manner of speech has also become accepted in common discourse. The research focused on extracting anti-Roma topics over this period using a hierarchical Bayesian model called Latent Dirichlet Allocation (LDA). The source of the analysis was collected from kuruc.info online newsportal which is the flagship of the far-right media in Hungary. The corpus consists of more than 10.000 anti-Roma news from 2006 until 2015. 27 anti-Roma topics were extracted by using LDA which opens the possibility to analyze the distribution of various topics over time and see how they are connected to the most influential events during the period of investigation. The identified topics correspond to categories identified by qualitative studies on Roma media representation in Hungary. Our research suggests that topic modeling could be a useful supplementary tool to the toolbox of traditional qualitative discourse analysis researchers. Our research project culminated into an interactive data visualization and a data visualization dashboard which can be accessed on following links:

 

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Budapest BI Forum

2016.10.27. 11:00 Szerző: zoltanvarju Címkék: tartalomelemzés képfeldolgozás dashboard Budapest BI Forum

Ma a Budapest BI Forumon részetesebben is bemutatjuk mivel foglalkozunk mostanában.

 

Balogh Kitti: Szövegvizualizációs dashboardok

Ma már nagyon sok információ automatikusan kinyerhető szöveges adatokból. De hogyan lehet az információt érthetően megjeleníteni? Lehetséges, hogy legalább valamilyen képet alkossunk több tízezer dokumentum tartalmáról? Mit mond nekünk, ha tudjuk, hogy egy adott szöveg pozitív vagy negatív hangvételű?

Előadásunkban konkrét példákon keresztül megmutatjuk, hogy open source eszközökkel a szövegek beszerzése, előfeldolgozása és vizualizációja is mindenki számára elérhető lehetőség.

 Varjú Zoltán: A Review of Image Retrieval Methods – a journey from image descriptors to neural networks

Although visual information is getting more and more common in the online world and researchers gave us plenty of tools to deal with it, it is still hard to find the right solution to the most common information retrieval tasks like finding duplicates, similar items and forming meaningful clusters from images. On a dataset with about 50k images we went through the traditional approaches like using image hashing and image descriptors for finding duplicates and clusters, we tried out image labeling solutions and we tested state-of-the-art variational autoencoders too. Of course, we compared and evaluated each and every solution and now we would like to share our experiences with you.

 

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Budapest.AI

2016.10.26. 14:33 Szerző: zoltanvarju Címkék: tartalomelemzés dashboard nyelvtechnológia BudapestAI társas gondolkodás

Ma a Budapest.AI rendezvényén adunk elő szeretett dashboardjainkról és arról, hogyan lehet a nyelvtechnológiát a társas gondolkodás megismerésére felhasználni. Alább diáink, az alatt pedig linkek a dashboardokhoz.

 

 

Visualizing Star Wars Movie Scripts

A kuruc.info romaellenes témái

Anti-Roma Topics on kuruc.info

Hungarian Teachers' Protest: What happened on Facebook?

News about migration in Hungarian online media

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Ezeken a konfokon találkozhatsz velünk októberben

2016.10.11. 15:33 Szerző: zoltanvarju Címkék: konferencia tartalomelemzés képfeldolgozás dashboard Precognox LDA deep learning

Az őszi konferencia szezon elindult, októberben az alábbi rendezvényeken találkozhattok velünk:

Budapest BI Forum, Október 25-27.

Budapest AI, Október 26.

  • Varjú Zoltán: Unveiling the narratives of the masses

precognoxlogo.png

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre