HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

The Revolution Will Not Be Televised

2013.04.18. 07:12 Szerző: Zoltán Varjú Címkék: társadalomtudomány tartalomelemzés közösségi média szövegbányászat nyelvtechnológia big data

"The revolution will not be televised, will not be televised,

will not be televised, will not be televised.

The revolution will be no re-run brothers;

The revolution will be live."

(Gil Scott Heron: The Revolution Will Not Be Televised)

 

Az arab tavasz, az M5S választási sikere, a szír felkelés eseményeiről tudósító Syria Deeply arra utal, hogy a közösségi média a változások katalizátora lehet. Nem véletlen, hogy kialakult egy új tudományág, a számítógépes társadalomtudomány (computational social science) ami az internet nyújtotta lehetőségeket kihasználva próbálja feltérképezni a társadalmat mozgató erőket. 

 

Szkeptikus hangok

 

Jevgenyi Morozov Belorussziában született és nőtt fel, volt alkalma megismerni Lukasenka, Európa utolsó diktátorának  elnyomó rendszerét. Morozov szerint az internet nem hozza el a korlátlan szabadságot, hiszen egyszerre nyújtja a globális kommunikáció lehetőségét a felhasználóknak és totális megfigyelés elérhetőségét az államoknak (és cégeknek stb.) A közösségi média szerepét is kétségbe vonja a társadalmi változásokban. A The Economist China and the Internet melléklete nagyon részletesen mutatja be, hogy a kommunista állam milyen módszerekkel tartja kontroll alatt netező polgárait. Az Aranypajzs (más néven Nagy Tűzfal) kifinomult technikái, a szorgos cenzorok és az öncenzúra kényesen ügyel arra, hogy milyen információ kerülhet nyilvánosságra. A nagy hírek rendre fennakadnak a tűzfalon, de akadnak olyan dolgok (pl. légszennyezés, alacsonyabb rangú pártkatonák és hivatalnokok mocskos ügyei stb.) melyek felszínre kerülhetnek.  Mindezek ellenére a leghíresebb kínai blogger Han Han kétségbe vonja a közösségi média forradalmi erejét:

“You feel everyone’s really angry, you feel like you could go open the window and you would see protesters on the street,” Mr Han said. “But once you open the window, you realise that there’s nothing there at all.” Microblogging, he said, encouraged people to tune into a big story briefly, almost as entertainment, until the next big story comes along. It did not bring about “any real change or progress”. (forrás)

Szürke tények

ArabSpring.jpg

A társadalomtudományokban a nyolcvanas években jelent meg a statisztikai tartalomelemzés, ami tkp. egyes szövegek statisztikai vizsgálatát jelentette sokáig (szógyakoriság szövegen belül ill. eltérések egyes szövegek között). A kilencvenes és kétezres évekre a  technológia és a számítógépes nyelvészet fejlődése lehetővé tette sokkal szofisztikáltabb eljárások alkalmazását is. Ilyenek például az ún. topik modellek vagy LDA (egy adott dokumentumhalmaz csoportosítása témák szerint) és az entitáskinyerő-eszközök (named entity recognition - névvel rendelkező entitások automatikus felismerése). Ezzel párhuzamosan az internet elterjedésével hatalmas mennyiségű szöveges információ keletkezett.

 

A tartalomelemzés egyik úttörője Gray King (Harvard, Department of Government). King és társai kimutatták, hogy a kínai mikroblogokról a kollektív cselekvésre buzdító bejegyzéseket törlik a hatóságok. Így az internet egy amolyan szelep, ahol a polgárok kiereszthetik dühüket, de a cenzorok kényesen ügyelnek arra, hogy ezt ne kövesse tényleges cselekvés a való világban.

 

Rich Nielsen a Harvard Department of Goverment PhD hallgatója azt vizsgálja miért válnak radikálissá egyes muszlim vallás- és jogtudósok (ulema). Még nem publikált, de már elérhető tanulmánya a Jihadi Radicalization of Muslim Clerics remek példa arra, hogyan alkalmazható a számítógépes nyelvészet a társadalomtudományi tartalomelemzésben. Az interneten elérhető, ulemák által írt szövegek tartalomelemzésével állapította meg, hogy mely írások radikálisak és melyek nem. Majd megvizsgálta a szerzők társadalmi beágyazottságát és azt találta, hogy azok radikalizálódnak leginkább, akik kevésbé beágyazottak a vallási vezetők közösségébe. (Bővebben a kutatásról a The Economiston)

 

Trey Causey a University of Washington PhD hallgatója az autoriter államok médiáit vizsgálja empirikus alapon. Disszertációjában a 2010 és 2011 közötti arab médiában megjelent híreket elemzi és arra kíváncsi, hogy a hírekkel miképp próbáltak hatni a forradalmi eseményeket szemlélőkre. Talán nem meglepő, hogy az eredmények szerint az állami médiák inkább a "felforgató" tevékenységre hívták fel a figyelmet, míg a civil és független médiák foglalkoztak inkább az elnyomó rendszerek viselt dolgaival. Annál érdekesebb, hogy arra a következtetésre jut, hogy az autokraták célja egy olyan egyensúlyi állapot megtalálása, ami még kellő információval látja el a lakosságot, ahhoz hogy ne bénuljon le az élet, de nem éri el azt a kritikus tömeget, hogy tényleges akciót idézzen elő. Han Han biztosan egyetért Causey-val. 

Optimista kívülállók

Az új technológia lehetőségei a számítástudomány és egyéb "kemény", matematizált tudományok művelőt is megihlették. Egyre több cég (köztük olyan nagyok mint a Microsoft, Facebook, Yahoo!) nyit külön "computational social science" részleget és fog bele társadalmi kérdések vizsgálatába. Oboler, Welsh és Cruz felhívta a figyelmet arra, hogy a közösségi oldalak vagy akár egy jó indikátor (pl. mobiltelefonok) vizsgálata önmagában semmit sem ér. Minden elemzéshez ismerni kell azt a kontextust, amiben a megfigyelt jelenségek történnek - ehhez pedig jó társadalomtudományi háttér szükségeltetik. A Nature egyik cikke is óvatosságra int. Az adatok sok dologra megtaníthatnak minket,de nem helyettesíthetik az elméleteket. Granovetter a hetvenes években egyszerűen kiokoskodta az ún. "gyenge kapcsolatok" elméletét, amit felhasználva közvetlenül tudott adatokat gyűjteni. Ezt a régóta közismert elméletet az utóbbi években sok "tudós" újra felfedezte a közösségi hálózatok elemzése során...

 

Bővebben

What Facebook Knows

Manifesto of computational social science (PDF)

Adatújságírás - vissza a gyökerekhez

Társadalmi kísérletek és big data

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr425219417

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása