HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

MSZNY - 2017, BEHARANGOZÓ

2017.01.25. 22:26 Szerző: nyirizsofi Címkék: konferencia dashboard NLP szentimentelemzés emócióelemzés MSZNY

 

Nagy örömmel és izgalommal tudatjuk, hogy a 2017. január 26-27-én, Szegeden megrendezésre kerülő XIII. Magyar Számítógépes Nyelvészeti Konferencián (MSZNY) három előadással is képviseljük magunkat.

 

Lehetőségünk nyílik bemutatni új eredményeinket a szentiment- és emócióelemzés terén, illetve poszterként reprezentálni egy szövegfeldolgozási projektünk audiovizualizációját interaktív dashboard segítségével. Folyamatos munkánk és kutatásaink során számtalan érdekes, és mindenekelőtt nyelvészeti szempontból fontos problémába ütközünk, amiket ezúttal szeretnénk megvitatni a konferencián résztvevő szakmai csoporttal és érdeklődökkel. Az MSZNY konferenciának idén is a Szegedi Tudományegyetem József Attila Tanulmányi és Információs Központja (TIK) ad otthont (Cím: 6722 Szeged, Ady tér 10.), ahol január 27-én, a következő időpontokban, a következő prezentációkkal találkozhattok velünk:

 

11:20 - Drávucz Fanni, Szabó Martina Katalin, Vincze Veronika: Szentiment- és emóciószótárak eredményességének mérése emóció- és szentimentkorpuszon

12:00 - Szabó Martina Katalin, Nyíri Zsófi, Morvay Gergely, Lázár Bernadett: A szentimentérték módosulásának vizsgálata szemantikai-pragmarikai szempontból annotált korpuszon

14:20 és 15:40 - Balogh Kitti, Fülöp Nóra, Szabó Martina Katalin: A 2016-os tanártüntetések szövegeinek feldolgozása és adatvizualizációja interaktív dashboard segítségével

Előadásaink egy-egy rövid ismertetőjével szeretnénk figyelmükbe ajánlani prezentációinkat:

 

Mivel az elmúlt időszakban nagyon szentimentálisak és emocionálisak voltunk, ezért két cikkünk is született a szentiment - és emócióelemzés témakörében. Egyrészről egy kézzel annotált korpuszon vizsgáltuk meg az emotív szemantikai tartalmú elemek egy speciális csoportját, a negatív emótív szemantikai tartalmú elemeket, másrészről pedig egy, szintén kézzel annotált, szentiment- és emóciókorpuszt elemeztünk, előbbit két különböző kategóriaszámú emóciószótárral, utóbbit pedig egy szentimentszótár segítségével. A szentimentérték módosulásával magyar nyelvű twitter-bejegyzések és az online elérhető annotáló program, a Brat segítségével kerültünk közelebbi kapcsolatba, míg a szentiment- és emócószótárak eredményességét a korpusz annotációja és a szótáras elemzés tapasztalatainak összevetése után tártuk fel. Bízunk benne, hogy bemutatott eredményeink, illetve a munka folyamatának és körülményeinek ismertetése, hozzásegíthet a vizsgált elemcsoport automatikus feldolgozásának fejlesztéséhez.

Természetesen mi sem maradhattunk ki a tavalyi tanártüntetésekből, és, habár csak vizuálisan, de az események mélyére ástuk magunkat! A 2016. Februári és márciusi történésekkel kapcsolatos posztokból és kommentekből létrehozott korpuszon végrehajtottunk egy automatikus emóció- és szentimentelemzést, majd pedig topik modellezéssel témákat nyertünk ki belőle. Az így kapott szemantikai adatokat vizualizáltuk egy interaktív dashboard segítségével, amit az MSZNY konferencián is bemutatunk!

kep1_6.png

kep2.png

 

Minden érdeklődöt szeretettel várunk, és köszönjük ha visszajelzésével segíti munkánkat. Találkozzunk január 26-27-én, Szegeden, az XIII. MSZNY konferencián!

http://rgai.inf.u-szeged.hu/index.php?lang=hu&page=mszny2017

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A multimodális keresés és tartalomelemzés lehetőségei @ conTEXT 2016

2016.11.29. 10:30 Szerző: Zoltán Varjú Címkék: keresés tartalomelemzés képfeldolgozás conTEXT

Ma a Clementine által szervezett conTEXT konferencián adunk elő multimodális tartalomelemzési kísérleteinkről. Ha nem tudtok eljönni, akkor ajánljuk a nyesten megjelent cikkünket a témában. Arról fogunk beszélni, hogy lehet a topik modellezést akár képekre is alkalmazni és ilyen szép kollázson megmutatni az eredményt:

hatarnal-keritesnel-uton-vizen.jpg

Varjú Zoltán: Van képünk hozzá! A multimodális keresés és tartalomelemzés lehetőségei

A keresés és a tartalomelemzés hagyományosan szövegekkel szeret foglalkozni, miközben az internetes tartalmak egyre inkább multimodálisak; szövegek, képek, videók és hanganyagok keverékei. Előadásunkban arra keressük a választ, hogy lehet-e egységes keretben reprezentálni a különféle modalitásokat. Egy gyakorlati példán keresztül pedig bemutatjuk, miképp vontuk be a hírelemzésbe a cikkekben szereplő képeket.

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Precognox @ YSM 2016

2016.11.04. 07:09 Szerző: Kitti Balogh Címkék: roma tartalomelemzés dashboard LDA

Ezen a hétvégén a Young Statistican Meeting-en adunk elő dashboardjainkról, topik modellekről és tartalomelemzésről. Alább megtalálható előadásunk absztrakja és a kapcsolódó diák.

 kip.png

Kitti Balogh: Unveiling latent topic structure in anti-Roma discourse using Latent Dirichlet Allocation 

From the mid 2000's the number of anti-Roma and racist utterances have been increasing in Hungary and this manner of speech has also become accepted in common discourse. The research focused on extracting anti-Roma topics over this period using a hierarchical Bayesian model called Latent Dirichlet Allocation (LDA). The source of the analysis was collected from kuruc.info online newsportal which is the flagship of the far-right media in Hungary. The corpus consists of more than 10.000 anti-Roma news from 2006 until 2015. 27 anti-Roma topics were extracted by using LDA which opens the possibility to analyze the distribution of various topics over time and see how they are connected to the most influential events during the period of investigation. The identified topics correspond to categories identified by qualitative studies on Roma media representation in Hungary. Our research suggests that topic modeling could be a useful supplementary tool to the toolbox of traditional qualitative discourse analysis researchers. Our research project culminated into an interactive data visualization and a data visualization dashboard which can be accessed on following links:

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Budapest BI Forum

2016.10.27. 11:00 Szerző: Zoltán Varjú Címkék: tartalomelemzés képfeldolgozás dashboard Budapest BI Forum

Ma a Budapest BI Forumon részetesebben is bemutatjuk mivel foglalkozunk mostanában.

 

Balogh Kitti: Szövegvizualizációs dashboardok

Ma már nagyon sok információ automatikusan kinyerhető szöveges adatokból. De hogyan lehet az információt érthetően megjeleníteni? Lehetséges, hogy legalább valamilyen képet alkossunk több tízezer dokumentum tartalmáról? Mit mond nekünk, ha tudjuk, hogy egy adott szöveg pozitív vagy negatív hangvételű?

Előadásunkban konkrét példákon keresztül megmutatjuk, hogy open source eszközökkel a szövegek beszerzése, előfeldolgozása és vizualizációja is mindenki számára elérhető lehetőség.

 Varjú Zoltán: A Review of Image Retrieval Methods – a journey from image descriptors to neural networks

Although visual information is getting more and more common in the online world and researchers gave us plenty of tools to deal with it, it is still hard to find the right solution to the most common information retrieval tasks like finding duplicates, similar items and forming meaningful clusters from images. On a dataset with about 50k images we went through the traditional approaches like using image hashing and image descriptors for finding duplicates and clusters, we tried out image labeling solutions and we tested state-of-the-art variational autoencoders too. Of course, we compared and evaluated each and every solution and now we would like to share our experiences with you.

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Budapest.AI

2016.10.26. 14:33 Szerző: Zoltán Varjú Címkék: tartalomelemzés dashboard nyelvtechnológia BudapestAI társas gondolkodás

Ma a Budapest.AI rendezvényén adunk elő szeretett dashboardjainkról és arról, hogyan lehet a nyelvtechnológiát a társas gondolkodás megismerésére felhasználni. Alább diáink, az alatt pedig linkek a dashboardokhoz.

 

 

Visualizing Star Wars Movie Scripts

A kuruc.info romaellenes témái

Anti-Roma Topics on kuruc.info

Hungarian Teachers' Protest: What happened on Facebook?

News about migration in Hungarian online media

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása