HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Adatújságírás - vissza a gyökerekhez

2013.03.26. 12:00 Szerző: Zoltán Varjú Címkék: társadalomtudomány adatújságírás The Guardian precision journalism Datablog Philip Meyer

Az adatújság megjelenése után sokan úgy gondolták, az új újságírók dolga az adatok gondozása (data curation) és elemzése lesz a jövőben, ahogy az a pénzügyi újságírásban már bevett évtizedek óta. Az adatokat valakik, valahol máshol, majd összegyűjtik szépen, legyenek azok kormányzati vagy éppen nemzetközi szervezetek, netán cégek. Az újságíró dolga annyi, hogy "emészthető" formában mondja el, mit rejtenek az adatok. De eljött 2011 és  az angliai zavargások!

london-riots.jpg

A The Guardian - hasonlóan sok más újsághoz - a kezdetektől nyomon követte a zavargásokat. A Datablog meglátta a Twitter-ben és egyéb közösségi oldalakban a potenciált és gyorsan el is kezdte elemezni milyen hírek terjednek a neten, hogyan reagálnak a zavargások résztvevői és a közvélemény az egyes eseményekre. Külön összeszedték az ilyenkor felröppenő álhíreket is és nagyon ötletesen vizualizálták ezeket. A lap kihasználta a modern technika lehetőségeit és a ma már megszokott módon kérte olvasóit, hogy tudósítsanak az általuk látott fejleményekről. Nagyon hamar rájöttek, ez csak arra jó, hogy egy hiányos leírását adják a történéseknek. Ennek legfőbb oka pedig az, hogy nem tudtak megfelelő adatokat szerezni. Részben maguk az elérhető adatok sem voltak megbízhatóak. Hiába bányászták akkurátusan a közösségi oldalakat az újságírók, ha a lázongók egymás között a Blackberry készülékek titkosított üzenetküldő szolgáltatását használták (mivel ez a funkció ingyenes a Balckberry tulajdonosok között, 2011-ben a gyártó készülékei a fiatal korosztályokban igen elterjedtek voltak) . Másrészt az egész brit társadalmat megrendítette az esemény és igazából senki sem értette miért törtek ki a zavargások, a közösségi oldalak státuszjelentéseiből a legelvakultabb szocmédia elemzők sem mernének mélyreható következtetéseket levonni. Nem maradt más választás, saját adatgyűjtésbe kezdett a Guardian, melyet Philip Meyer inspirált. 

1967-ben zavargások törtek ki Detroitban. A városban már történt hasonló 1943-ban, de intenzitásában és az okozott kár értékében a hatvanhetesnek sikerült olyan kétes hírű rekordot felállítani, melyet csak a '92-es Los Angeles-i zavargások múltak felül. A fiatal Meyer épp a Harvard Egyetem Nieman fellowship éve után volt, mely során alapos társadalomtudományi és adatbáziskezelési képzésben részesült, nem csoda, hogy égett a vágytól, hogy frissen szerzett tudását kamatoztassa. A Detroit Free Press lap a zavargások során nagyon lelkiismeretesen tudósított a fejleményekről és nyitott volt Meyer új ötleteire is. A város és különböző alapítványok segítségével felállítottak egy újságírókból, társadalomtudósokból és önkéntesekből álló csoportot. Egy hét alatt megállapodtak az adatfelvétel metodikájáról és betanították az önkénteseket (főleg a környék fekete iskoláinak tanárait) a lekérdezésre. A második héten megtörtént az adatfelvétel. A harmadik héten már lyukkártyán voltak a lekérdezések eredményei és megindult az elemzői munka, mely végén megszületett a speciális lapszám.

free_press.png

A vizsgálat eredményei megdöbbentőek voltak sokak számára. A közhiedelem szerint a zavargások résztvevői a déli államokból bevándorolt, iskolázatlan, mezőgazdasági vidékről érkező feketék voltak, de bebizonyosodott, a többé kevésbé integráltnak hitt feketék vettek részt a sajnálatos eseményekben. Szintén kiderült, hogy jócskán túlbecsülték a zavargók létszámát is. De ami a legmegdöbbentőbb volt az, hogy a magát toleránsnak gondoló észak is ellenségesen viselkedett a feketékkel szemben, ami komoly elégedetlenséghez vezetett köztük.

preview.jpg

A Guardian a London School of Economics-szal (LSE) fogott össze és egy ambiciózus 10 hónapos projekt keretében újságírók és társadalomtudósok boncolgatták az angliai zavargások okait. A Reading the Riots ma a legátfogóbb gyűjteménye a modern, adatvezérelt, oknyomozó újságírásnak és riportoknak. A kutatás első fázisában a zavargásokban résztvevő személyekkel készítettek interjúkat és vettek fel kérdőíveket. A második fázisban az intézkedő hatósági személyektől (rendőrök, bírók stb.) gyűjtöttek adatokat. Így olyan dolgok derültek ki mint például mennyire messze laktak az elkövetők az elkövetés helyétől és összefügg-e a szegénységgel a zavargás. Ehhez kapcsolódóan a zavargók legvalószínűbb útvonalait is feltérképezték. Külön összegyűjtötték a kutatók, hogy kik milyen büntetést kaptak a zavargások során elkövetett törvényszegésekért. Az LSE később összeállított összegző tanulmánya is elérhető online.

Talán úgy tűnik, az adatújságírás felforgatta a médiát. Ez korántsem igaz. A print média válságban van, pár kivételtől eltekintve a példányszámok folyamatosan csökkennek. Az ingyenes online híroldalak is nehezen tudnak bevételre szert tenni. Az adatújságírás részben egy természetes reakció, amivel új utakat keres magának a szakma. A Kinght Foundation, a Knight-Mozilla OpenNews és a Nieman Journalism Lab olyan kezdeményezéseket karol fel, melyek új utakat mutatnak. A befektetők is egyre nagyobb fantáziát látnak az új utakra tévedő startupokban, mint pl. a Circa, a Silkapp és a Prismatic. Ugyanakkor megjelentek, az olyan hagyományos elemzőműhelyekre hasonlító vállalkozások (pl. a Quid és a Palantir), melyek az adatok begyűjtésére és elemzésére is nagy hangsúlyt fektetnek.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr95159597

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása