HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adatbányászat (9) adatelemzés (6) adatok (13) adatújságírás (16) adatvizualizáció (18) AI (14) alternatív (6) alternatív keresőfelület (26) beszédtechnológia (13) big data (51) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (8) deep learning (15) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (15) Google (24) google (57) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) internetes keresés (27) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (68) kereséselmélet (8) keresés jövője (55) keresés problémái (39) keresők összehasonlítása (9) keresőoptimalizálás (6) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (24) korpusznyelvészet (14) közösségi keresés (8) közösségi média (6) különleges keresők (7) kutatás (7) LDA (10) lda (10) live (13) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (14) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP meetup (17) Nuance (9) nyelv (6) nyelvészet (30) nyelvtechnológia (73) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (55) Precognox Labs (14) Python (13) R (19) spam (6) statisztika (11) számítógépes nyelvészet (8) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (35) szövegbányászat (18) társadalomtudomány (7) tartalomelemzés (55) tartalomjegyzék (6) tematikus kereső (19) topik modellek (6) twitter (15) Twitter (18) vertikális kereső (9) vizualizáció (13) yahoo (26) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Így cenzúrázd az internetet

2014.02.26. 08:42 Szerző: Zoltán Varjú Címkék: internet cenzúra Twitter forradalom

Mikal Hem Kezdő diktátorok kézikönyve című művéből megtudhatjuk, miképp nyerhetünk 99.9%-al a választásokon, hogyan építsünk ki személyi kultuszt, vagy éppen teremtsünk saját építészeti irányzatot. De egy igazi diktátor ellenőrzi azt is, hogy milyen információhoz jut hozzá népe, amiről sajnálatos módon a kötet hallgat. Jó hírünk van a kedves olvasóknak, a dekadens nyugati világ kutatói a legszofisztikáltabb internetes cenzúrát tanulmányozva megírták a receptet!

480x.jpg

Abdelberi Chaabane és tsai az Inria kutatóintézetben a szír Telecomix hacker csapat által nyilvánosságra hozott adathalmazt elemezve mutatják be a Censorship in the Wild: Analyzing Web Filtering in Syria című tanulmányukban. A Technology Review-nak nyilatkozva Chaabane felhívja a figyelmet arra, hogy csupán a webforgalom 1%-át korlátozzák a hatóságok - ez arra utal, hogy ma már nem comme il faut csak úgy en block letiltani a netet, egy rendes elnyomó rendszer a kritikus pontokra összpontosít!

Their analysis of this data reveals some surprising facts. It turns out the Syrians were censoring only a small fraction of the traffic, less than 1 per cent. “The vast majority of requests is either allowed (93.28%) or denied due to network errors (5.37%),” say Chaabane and co.

But this 1 per cent shows exactly how Syrian authorities conducted censorship at that time. “We found that censorship is based on four main criteria: URL-based filtering, keyword-based filtering, destination IP address, and a custom category-based censorship,” say Chaabane and co.

The Syrians concentrated their URL-based filtering on instant messaging software such as Skype, which is heavily edited. And much of the blocked keywords and domains relate to political news content as well as video sharing and censorship-circumvention technologies.

658_001.jpg

Gary King és tsai időt, pénzt és energiát nem spórolva a legjobbakhoz fordultak, hogy elkészítsék Reverse Engineering Chinese Censorship through Randomized Experimentation and Participant Observation című tanulmányukat. A közösségi média ma már a mindennapok része, még a diktatúrákban is. Jászberényi Sándor a Budapest-Kairóban egy angol újságíróval beszélgetve döbben rá, hogy bizony a social media kikapcsolása csak ront a diktátorok helyzetén, különösen zavargások idején, hiszen feláll a gép elől a fiatalság és más, sokkal nehezebben követhető applikációk után néz:

"Ki csinálta a forradalmat?", kérdezem Davidet. "A kormányközeli média azt mondja, hogy az iszlamisták."

"Hazudnak. Nem az iszlamisták."

"Az ellenzék?"

"Az ellenzék tüntetést szervezett, nem forradalmat."

"Akkor ki?"

"A Twitter meg a Facebook", mondja David. És nem viccel.

[...] Az internet leállítása sosem látott tömegeket vitt ki az utcára, olyanokat, akik egyébként nem mentek volna ki. A rezsim lebecsülte az emberek információ iránti igényét. [...] El lehet venni egy embertől a szabad választásokat, a demokráciát, el lehet venni a szabadságjogainak nagy részét, de nem vehetik el a kommunikációs eszközeit, melyeket használ és ismer. Senki sem fog önként sötétségben maradni, elvágva mindentől és mindenkitől.

 

[...] Egy másik feltevés szerint a rendőrség a posztok és tweetek GPS adatait követve, valamint a közösségi médiát monitorozva csapott le csoportokra. Ezután a kormányellenes tüntetők a különböző oldalakon zárt csoportokat hoztak létre, melyekben nem tudják lenyomozni őket, illetve megugrott az olyan mobilappok népszerűsége is, melyek elrejtik a felhasználó aktuális pozícióját. A Hotspot Shield nevű alkalmazás törökországi letöltéseinek száma pl. 120.000-rel nőtt az elmúlt egy hétben.

 


download.jpg

 

Az egyiptomi helyzethez hasonló bonyodalmakat senki sem akar! King és tsai nem csupán a kínai közösségi médiát monitorozták, a felhasználókat bevonva végeztek vizsgálatokat és egy saját közösségi oldal felállításába is belevágtak, csak azért, hogy testközelből kapjanak információt a kínai hatóságok működéséről. Már maga a tanulmány absztraktja is impresszív!

Chinese government censorship of social media constitutes the largest coordinated selective suppression of human communication in recorded history. Although existing research on the subject has revealed a great deal, it is based on passive, observational methods, with well known inferential limitations. For example, these methods can reveal nothing about censorship that occurs before submissions are posted, such as via automated review which we show is used at two-thirds of all social media sites. We offer two approaches to overcome these limitations. For causal inferences, we conduct the first large scale experimental study of censorship by creating accounts on numerous social media sites spread throughout the country, submitting different randomly assigned types of social media texts, and detecting from a network of computers all over the world which types are censored. Then, for descriptive inferences, we supplement the current uncertain practice of conducting anonymous interviews with secret informants, by participant observation: we set up our own social media site in China, contract with Chinese firms to install the same censoring technologies as their existing sites, and -- with direct access to their software, documentation, and even customer service help desk support -- reverse engineer how it all works. Our results offer the first rigorous experimental support for the recent hypothesis that criticism of the state, its leaders, and their policies are routinely published, whereas posts about real world events with collective action potential are censored. We also extend the hypothesis by showing that it applies even to accusations of corruption by high-level officials and massive online-only protests, neither of which are censored. We also reveal for the first time the inner workings of the process of automated review, and as a result are able to reconcile conflicting accounts of keyword-based content filtering in the academic literature. We show that the Chinese government tolerates surprising levels of diversity in automated review technology, but still ensures a uniform outcome by post hoc censorship using huge numbers of human coders.

Jó tudni, hogy az ismertetett tanulmányok szabad hozzáférésűek, ezért nem csak saját cenzúránk felállításához, de akár annak kijátszásához is felhasználhatóak - jobb ha rögtön blokkoljuk a tudományos oldalakat hatalomra kerülésünk után!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr775833274

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.