Szeretünk elmélázni a bloggal kapcsolatos statisztikák felett és következtetéseket levonni arra nézve, milyen tartalommal lenne a legjobb megörvendeztetni olvasóinkat. A legjobb visszajelzés viszont az, amikor ténylegesen is találkozunk a Kereső Világ olvasóival és elmondják nekünk mit szeretnek és mit nem szeretnek a blogon. Szeretnénk azonban több embert elérni és bevonni a blog témáinak alakításába, ezért kérjük látogatóinkat az alábbi rövid kérdőív kitöltésére - a pár perces kitöltés jutalma, reményeink szerint, még tartalmasabb posztok lesznek.
Big Data - Keresés - Számítógépes nyelvészet - Szövegbányászat - Gépi tanulás - NLP Meetup - Precognox
Milyen legyen jövőre a Kereső Világ?
2013.12.10. 08:00 Szerző: kérdőív Kereső Világ
Címkék:A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre
Context is King : A kontextus mindent visz - Telenor Okostelefon Akadémia
2013.12.05. 08:00 Szerző: mobil keresés konferencia mobil keresés kontextus Telenor Okostelefon Akadémia
Címkék:November 27-én a Telenor Okostelefon Akadémián adtam elő Context is King: A kontextus mindent visz címmel. Alább megtalálhatjátok a kapcsolódó prezentációt és az előadás főbb pontjaihoz kapcsolódó korábbi posztokat.
A fenti videóban az esemény előadói röviden összefoglalják előadásaikat.
Az előadás gondolatmenetét pontokba szedtem és az egyes részekhez a blog kapcsolódó írásait linkeltem:
- A kontextus óriási ereje
- A mobil nyújtotta kontextus értelmezési keretet nyújt, pl. a lokációs keresők jelentősen megkönnyítik a keresést - Azt beszéli már az egész város, Google Now - a gondolatolvasó
- A közösségi média további kontextusokat nyit meg, hiszen alapvetően társas lények vagyunk - Yandex Wonder - ami a Facebook Graph Search szeretne lenni
- A Google új keresőmotorja, a Hummingbird is igyekszik összekapcsolni a faktuális tudást a kontextus nyújtotta értelmezési kerettel - Google Hummingbird
- A mobiltelefonok szenzorai által nyújtott lehetőségeknek még csupán igen kis szeletét használjuk ki. A cél, hogy jobban integráljuk ezeket - pl. Beszédfelismerős cégkereső
- Próbálkozzunk, hiszen Tony Stark is megmondta: Sometimes you gotta run, before you can walk!
Ezúton is köszönöm a szervezőknek a meghívást és a jó hangulatú rendezvényt. Az előadás anyagára alapozott, de jelentősen kibővített poszttal jelentkezünk hamarosan a blogon!
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre
Ki a bura alól!
2013.12.02. 08:00 Szerző: nyelvtechnológia Twitter filter bubble Nudge libertariánus paternalizmus
Címkék:A perszonalizáció egyrészt nélkülözhetetlen, hiszen nélküle elvesznénk az adatok tengerében. Másrészt a szűrők alkalmazása elvezet az ún. filter bubble kialakulásához. Graells-Garrido és tsai Data Portraits: Connecting People of Opposing Views tanulmányukban egy olyan módszert mutatnak be, mely segíti a közösségi média felhasználóit abban, hogy nézeteikkel ellentétes véleményeket is elolvassanak. De kell-e ezt erőltetni, vagy inkább bízzuk az emberekre, hogy jó-e nekik a saját kis burájuk?
A kutatók vizsgálatukhoz a chilei csiripelők abortusszal kapcsolatos vitáinak alakulását vették górcső alá. A Twitteren végzett keresés segítségével LDA eljárással állapították meg, milyen témákba (topikok) csoportosíthatóak a tweetek. A #pro-choice és #pro-life hashtagek spanyol megfelelőinek használata segített eldönteni, hogy melyik véleményt képviselik az egyes bejegyzések, ill. milyen "köztes témák" fordulnak elő mindkét oldalon.
Ahogyan a fenti ábrán is látható, élesen elkülönülnek az egyes vélemények! A közösségi médiában tapasztalható homofília (l Birds of Feather: Homophily in Social Networks) miatt érthető, hogy nincs sok kapcsolat általában az ennyire eltérő véleményeket képviselő emberek között.
A nagy kérdés az, miképp lehetne egy adott nézet elkötelezett hívét megismertetni az ellentétes véleményekkel. Itt két probléma merül fel rögtön. Először is nagyon szeretünk gyorsan dönteni, ezért ha valami nem tetszik, azzal nem is foglalkozunk. Másodszor pedig kognitív disszonancia jelentkezik, amikor valamilyen számunkra szokatlan információval találkozunk az szorongáshoz vezet, amit csökkenteni szeretnénk; ennek több útja is van, az egyik legkézenfekvőbb az, hogy nem keressük azokat a helyzeteket, melyek zavart okozhatnak. Ezen megfontolások mentén Graells-Garrido és tsai egy olyan témafelfedező felületet fejlesztettek ki, ami egy szófelhő mentén jeleníti meg a kapcsolódó kulcsszavakat. Az egyes kulcsszavakra kattintva megjelennek a kapcsolódó bejegyzések. A szófelhőben ügyesen a köztes témák beiktatásával sikerült csökkenteni a kezdeti idegenkedést és kognitív disszonancia jelenségét. Miután köztes témákkal is találkoztak a felhasználók, egyre több ellentétes vélemény is megjeleníthetővé válik, amit a kutatási résztvevők a kérdőíves vizsgálatok alapján kifejezetten jól fogadtak.
A tanulmányban többször előfordul a "nudge" szó, ami kb. terelgetést, (finom) bökdösést jelent, de egyben utalás Thaler és Sunstein azonos című könyvére is, ami az ún. libertárius paternalizmus egyik népszerűsítő műve. Úgy gondoljuk, hogy egy demokráciában jó dolog, ha a polgárok megismerik egymás álláspontját a közügyeket illetően és a filter bubble ez ellen dolgozik. Azonban az egy külön kérdés, hogy aktívan be kell-e avatkoznunk a kívánt viselkedés eléréséhez!
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre
Szövegbányászat - BURN meetup előadás
2013.11.30. 08:39 Szerző: meetup tm szövegbányászat wordcloud R BURN
Címkék:Szerdán a BURN meetupon adtam elő és a szervezők jóvoltából az előadás megtekinthető a YouTube-on is immár. A kapcsolódó prezentáció pedig elérhető itt.
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre
A szavak titkos élete - conTEXT prezentációm
2013.11.29. 18:41 Szerző: prezentáció konferencia számítógépes nyelvészet conTEXT
Címkék:Múlt héten a Clementine conTEXT - szöveganalitika magyarul konferencián vettem részt - a lehetőséget és a sok érdekes előadást ezúton is köszönöm a szervezőknek és a kollégáknak! Mivel sokan kérték, közzéteszem itt a prezentációmat és korábbi posztokat linkelek alatta, melyek segítenek eligazodni az említett elméletek tengerében.
Az előadás főbb pontjai és a hozzájuk kapcsolódó korábbi posztok:
- Szándékos viselkedésünkkel nagyon sokat elárulunk magunkról a neten - Lájkolj, s megmondom ki is vagy!
- Egy egyszerű szógyakoriságra alapozott vizsgálattal is sok olyan dolog kideríthető, amit nem szándákosan árul el rólunk nyelvi viselkedésünk - Mit árul el rólad a Twitter fiókod?
- A sima szógyakoriságon alapuló elemzéseknek és szófelhőknek megvannak a maguk korlátai - Miről beszél @dajcstomi? Miről csiripelnek a politikusok? FIDESZ vs. MSZP - miről beszélnek a közösségi médiában?
- A szótáralapú szentiment- és emócióelemzés már sokkal jobb értelmezési keretet ad - Rossz híre van hazánknak 1? és 2
- A "More Tweets, More Vote" elv arra hívja fel a figyelmet, hogy a puszta említésgyakoriság jó prediktor lehet. Ezt a pollyanna jelenséggel szokták magyarázni, azonban több jel is arra utal, hogy ez nem igaz. - Több csirip, több szavazat Pollyanna a magyar weben
- Úgy tűnik, a nyelvben is jelen vannak ún. kognitív torzulások (cognitive bias), melyeket a pénzügyi hírelemzés területén figyeltek meg először - Hírelemzés
- A kognitív tudomány, a kognitív nyelvészet és a pszichológia területén találhatunk olyan elméleteket, melyek segíthetnek feltárni ezeket a kognitív torzulásokat - Nekünk elmélet kell! Mindennapi metaforák
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.