HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Milyen legyen jövőre a Kereső Világ?

2013.12.10. 08:00 Szerző: Zoltán Varjú Címkék: kérdőív Kereső Világ

Szeretünk elmélázni a bloggal kapcsolatos statisztikák felett és következtetéseket levonni arra nézve, milyen tartalommal lenne a legjobb megörvendeztetni olvasóinkat. A legjobb visszajelzés viszont az, amikor ténylegesen is találkozunk a Kereső Világ olvasóival és elmondják nekünk mit szeretnek és mit nem szeretnek a blogon. Szeretnénk azonban több embert elérni és bevonni a blog témáinak alakításába, ezért kérjük látogatóinkat az alábbi rövid kérdőív kitöltésére - a pár perces kitöltés jutalma, reményeink szerint, még tartalmasabb posztok lesznek.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Context is King : A kontextus mindent visz - Telenor Okostelefon Akadémia

2013.12.05. 08:00 Szerző: Kereso75 Címkék: mobil keresés konferencia mobil keresés kontextus Telenor Okostelefon Akadémia

November 27-én a Telenor Okostelefon Akadémián adtam elő Context is King: A kontextus mindent visz címmel. Alább megtalálhatjátok a kapcsolódó prezentációt és az előadás főbb pontjaihoz kapcsolódó korábbi posztokat.

A fenti videóban az esemény előadói röviden összefoglalják előadásaikat.

Az előadás gondolatmenetét pontokba szedtem és az egyes részekhez a blog kapcsolódó írásait linkeltem:

Ezúton is köszönöm a szervezőknek a meghívást és a jó hangulatú rendezvényt. Az előadás anyagára alapozott, de jelentősen kibővített poszttal jelentkezünk hamarosan a blogon!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Ki a bura alól!

2013.12.02. 08:00 Szerző: Zoltán Varjú Címkék: nyelvtechnológia Twitter filter bubble Nudge libertariánus paternalizmus

A perszonalizáció egyrészt nélkülözhetetlen, hiszen nélküle elvesznénk az adatok tengerében. Másrészt a szűrők alkalmazása elvezet az ún. filter bubble kialakulásához. Graells-Garrido és tsai Data Portraits: Connecting People of Opposing Views tanulmányukban egy olyan módszert mutatnak be, mely segíti a közösségi média felhasználóit abban, hogy nézeteikkel ellentétes véleményeket is elolvassanak. De kell-e ezt erőltetni, vagy inkább bízzuk az emberekre, hogy jó-e nekik a saját kis burájuk?

2013-12-01 16.42.38.png

A kutatók vizsgálatukhoz a chilei csiripelők abortusszal kapcsolatos vitáinak alakulását vették górcső alá. A Twitteren végzett keresés segítségével LDA eljárással állapították meg, milyen témákba (topikok) csoportosíthatóak a tweetek. A #pro-choice és #pro-life hashtagek spanyol megfelelőinek használata segített eldönteni, hogy melyik véleményt képviselik az egyes bejegyzések, ill. milyen "köztes témák" fordulnak elő mindkét oldalon.

2013-12-01 16.37.49.png

Ahogyan a fenti ábrán is látható, élesen elkülönülnek az egyes vélemények! A közösségi médiában tapasztalható homofília (l Birds of Feather: Homophily in Social Networks) miatt érthető, hogy nincs sok kapcsolat általában az ennyire eltérő véleményeket képviselő emberek között.

2013-12-01 16.45.02.png

A nagy kérdés az, miképp lehetne egy adott nézet elkötelezett hívét megismertetni az ellentétes véleményekkel. Itt két probléma merül fel rögtön. Először is nagyon szeretünk gyorsan dönteni, ezért ha valami nem tetszik, azzal nem is foglalkozunk. Másodszor pedig kognitív disszonancia jelentkezik, amikor valamilyen számunkra szokatlan információval találkozunk az szorongáshoz vezet, amit csökkenteni szeretnénk; ennek több útja is van, az egyik legkézenfekvőbb az, hogy nem keressük azokat a helyzeteket, melyek zavart okozhatnak. Ezen megfontolások mentén Graells-Garrido és tsai egy olyan témafelfedező felületet fejlesztettek ki, ami egy szófelhő mentén jeleníti meg a kapcsolódó kulcsszavakat. Az egyes kulcsszavakra kattintva megjelennek a kapcsolódó bejegyzések. A szófelhőben ügyesen a köztes témák beiktatásával sikerült csökkenteni a kezdeti idegenkedést és kognitív disszonancia jelenségét. Miután köztes témákkal is találkoztak a felhasználók, egyre több ellentétes vélemény is megjeleníthetővé válik, amit a kutatási résztvevők a kérdőíves vizsgálatok alapján kifejezetten jól fogadtak.

200px-Nudge-cover.jpg

A tanulmányban többször előfordul a "nudge" szó, ami kb. terelgetést, (finom) bökdösést jelent, de egyben utalás Thaler és Sunstein azonos című könyvére is, ami az ún. libertárius paternalizmus egyik népszerűsítő műve. Úgy gondoljuk, hogy egy demokráciában jó dolog, ha a polgárok megismerik egymás álláspontját a közügyeket illetően és a filter bubble ez ellen dolgozik. Azonban az egy külön kérdés, hogy aktívan be kell-e avatkoznunk a kívánt viselkedés eléréséhez!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Szövegbányászat - BURN meetup előadás

2013.11.30. 08:39 Szerző: Zoltán Varjú Címkék: meetup tm szövegbányászat wordcloud R BURN

Szerdán a BURN meetupon adtam elő és a szervezők jóvoltából az előadás megtekinthető a YouTube-on is immár. A kapcsolódó prezentáció pedig elérhető itt.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A szavak titkos élete - conTEXT prezentációm

2013.11.29. 18:41 Szerző: Zoltán Varjú Címkék: prezentáció konferencia számítógépes nyelvészet conTEXT

Múlt héten a Clementine conTEXT - szöveganalitika magyarul konferencián vettem részt - a lehetőséget és a sok érdekes előadást ezúton is köszönöm a szervezőknek és a kollégáknak! Mivel sokan kérték, közzéteszem itt a prezentációmat és korábbi posztokat linkelek alatta, melyek segítenek eligazodni az említett elméletek tengerében.

Az előadás főbb pontjai és a hozzájuk kapcsolódó korábbi posztok:

  1. Szándékos viselkedésünkkel nagyon sokat elárulunk magunkról a neten - Lájkolj, s megmondom ki is vagy!
  2. Egy egyszerű szógyakoriságra alapozott vizsgálattal is sok olyan dolog kideríthető, amit nem szándákosan árul el rólunk nyelvi viselkedésünk - Mit árul el rólad a Twitter fiókod?
  3. A sima szógyakoriságon alapuló elemzéseknek és szófelhőknek megvannak a maguk korlátai - Miről beszél @dajcstomi? Miről csiripelnek a politikusok? FIDESZ vs. MSZP - miről beszélnek a közösségi médiában?
  4. A szótáralapú szentiment- és emócióelemzés már sokkal jobb értelmezési keretet ad - Rossz híre van hazánknak 1? és 2
  5. A "More Tweets, More Vote" elv arra hívja fel a figyelmet, hogy a puszta említésgyakoriság jó prediktor lehet. Ezt a pollyanna jelenséggel szokták magyarázni, azonban több jel is arra utal, hogy ez nem igaz. - Több csirip, több szavazat Pollyanna a magyar weben
  6. Úgy tűnik, a nyelvben is jelen vannak ún. kognitív torzulások (cognitive bias), melyeket a pénzügyi hírelemzés területén figyeltek meg először - Hírelemzés
  7. A kognitív tudomány, a kognitív nyelvészet és a pszichológia területén találhatunk olyan elméleteket, melyek segíthetnek feltárni ezeket a kognitív torzulásokat - Nekünk elmélet kell! Mindennapi metaforák

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása