HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás megoldásokat.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Főbb témák

adatbányászat (6) adatok (12) adatújságírás (16) adatvizualizáció (17) AI (14) alternatív (6) alternatív keresőfelület (24) beszédtechnológia (13) big data (48) bing (14) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (8) deep learning (15) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (15) Google (23) google (57) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) internetes keresés (26) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (57) kereséselmélet (7) keresés jövője (54) keresés problémái (38) keresők összehasonlítása (9) keresőoptimalizálás (6) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (24) korpusznyelvészet (14) közösségi keresés (8) közösségi média (6) különleges keresők (7) kutatás (6) lda (10) LDA (10) live (13) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (12) metafora (7) mobil (37) mobil keresés (17) Neticle (8) NLP meetup (17) Nuance (9) nyelv (6) nyelvészet (28) nyelvtechnológia (73) open data (11) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (47) Precognox Labs (14) Python (13) R (19) spam (6) statisztika (11) számítógépes nyelvészet (8) szemantikus keresés (18) szemantikus kereső (9) szentimentelemzés (34) szövegbányászat (15) társadalomtudomány (7) tartalomelemzés (54) tartalomjegyzék (6) tematikus kereső (19) topik modellek (6) Twitter (18) twitter (15) vertikális kereső (9) vizualizáció (12) yahoo (26) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Politikai véleményárfolyam - avagy miről beszél az internet népe?

2013.12.18. 08:00 Szerző: zoltanvarju Címkék: vendég nyelvtechnológia Neticle Méltányosság szentimentelemzés Politikai véleményárfolyam

Lassan egy éve indult útjára a Neticle Technologies és a Méltányosság Politikaelemző Központ Politikai Véleményárfolyam elemzése, ami világviszonylatban is egyedülálló. Legjobb tudomásunk szerint nincs más hasonló, rendszeresen megjelenő, internetes tartalmakra alapozott, mindenki számára hozzáférhető elemzés. Ahogyan arról többször beszámoltunk blogunkon, a közösségi tartalmakra alapozott elemzések és előrejelzések egyre népszerűbbek, de ezek többsége egy-egy eseményhez kötődik (pl. Bollen és tsai az Egyesült Államok 2008-as elnökválasztását, Jungherr pedig a 2009-es németországi választásokat vizsgálta), ezért úgy gondoltuk, a Szekeres Péter a Neticle vezető kutatójához és Szakács Andráshoz a Méltányosság elemzőjéhez fordulunk, hogy egyedülálló tapasztalataik alapján egy kicsit jobban el tudjunk igazodni a területen.

neticle_logo.png

Ritka, amikor egy technológiai cég és egy hagyományos elemzőközpont működik együtt. Röviden bemutatnátok magatokat és mesélnétek a nagy találkozásról, ami után elindult a Politikai Véleményárfolyam?

 


szp_1.jpgSz.P.: A Neticle Technologies egy magyar startup, amit azzal a céllal hoztunk létre 2 évvel ezelőtt, hogy webes szövegek automatikus elemzésével csináljunk izgalmas dolgokat. A Neticle nevű szoftverünkkel össze tudjuk gyűjteni közel valós időben a publikus magyar nyelvű szövegeket  a webről (cikkeket, blogokat, fórum és közösségi oldal bejegyzéseket), és ezeket automatikusan véleményelemezzük is. Így jön létre a véleményárfolyam nevű saját mutatónk, ami tulajdonképpen megmutatja a webes hangulat alakulását amire csak szeretnénk: márkákra, cégekre, személyekre, stb.

 

velemenyarfolyam.pngA Neticle véleményárfolyam azt mutatja meg, hogy egy adott időszakban hogyan alakul adott kulcsszó (vagy kulcsszavak) megítélése a magyar weben. A rendszer úgy kalkulálja a véleményárfolyamot, hogy összeadja folyamatosan az említések véleményindexét. A véleményárfolyam hasonlóan értelmezhető, mint a részvényárfolyam: az emelkedése az internetezők pozitív hangulatát, míg csökkenése az internetezők negatív hangulatát fejezi ki a kulcsszóval kapcsolatban.

 

 

A Méltányosságos srácokkal való megismerkedést a blog egyik szerzőjének, Varjú Zolinak köszönhetjük, remek kapcsolat alakult ki a politikai szakértői csapattal. Nagyon fontos volt, hogy már az elején láttuk, hogy nyitottak az újdonságokra, és hamar átlátták, hogy mit tud és mit nem tud a rendszerünk, és hogyan lehetne ezt elemzési és politikai tudással egy új és érdekes elemzési sorozattá alakítani.  Az eltelt idő alatt pedig  több olyan visszajelzés is érkezett a csapattól, amiknek köszönhetően sokat fejlődött a Neticle.

 



szakacs_andras_1.jpgSz.A.: A Méltányosság Politikaelemző Központ egy olyan professzionális politikaelemző intézet, mely a nagy múltú, nyugati agytrösztök nyomdokain kíván haladni. Politikakutatásokat, gyorselemzéseket, felméréseket, prognózisokat és átfogó szakpolitikai elemzéseket végez.  Központi témánknak a hazai kohézió kutatást választottuk, amelyről fájóan kevés szakmai anyag és tudományos kutatás született a rendszerváltás óta, pedig – ahogy azt már Európában felismerték – ennek a kérdése az, ami választ adhat egy-egy nemzet, vagy közösség sikereire, vagy sorozatos kudarcaira. Évek óta az érdekel bennünket, hogy hogyan lehetne a politikáról való gondolkodást egy kicsit kimozdítani a megszokott dagonyázás keretei közül. A Neticle volt az a cég, ami létrehozta azt az eszközt – a Véleményárfolyam formájában – amivel közösen képesek vagyunk erre. Jelenleg napi kapcsolatban állunk és zökkenőmentes az együttműködés, hiszen bármilyen új ötlet, vagy hibajavítás nem csak meghallgatásra talál, de meg is valósul rövid időn belül. Számunkra is fontos tanulság, hogy mennyire jól össze tud dolgozni két olyan cég, amely között hagyományos értelemben – de legfőképp a hazai viszonyok között - csak minimális mennyiségű közös pont található. Úgy gondolom az elmúlt egy évben sikerült összecsiszolódnunk és jól kiegészítjük egymást a közös projektben.

 

Hogyan képzeljük el az egyes jelentések elkészítését?

 

Sz.P.: A mi munkánk akkor volt jelentősebb, amikor beállítottuk a figyelt kulcsszavakat, tehát a pártok és elemzett személyek neveit. Itt feltártuk az írásmódokat, szinonimákat és ami ezen a területen különösen a releváns lehet, a nezetők által használt gúnyneveket (pl.: cucialisták, jaffások).  Persze ebben is sok segítséget kaptunk a Méltányosságtól. Itt hasznos volt nagyon például a Jobbik kulcsszónál, hogy megkülönböztetünk kisbetűt és nagybetűt a kulcsszó szinonimáknál, és csak az lesz találat, amely szövegben pontos egyezés van valamelyik kulcsszó szinonimával. Emiatt például kicsit komplexebb nálunk egy kulcsszó létrehozása mint egy Google keresés, de cserébe nagyon pontos találatokat kapunk.

szinonimak.png

Ezt követően a Neticle csapat elsősorban a véleményelemzési algoritmusunk szótárait finomítja saját tesztelés vagy éppen a Méltányosság visszajelzései alapján. A rendszerünk egy úgynevezett saját szemantikus mátrix szerint próbál felismerni akár sok szavas kifejezéseket, ezek elemeit folyamatosan finomhangoljuk, hogy minél pontosabb legyen a dolog. A rendszeres elemzések oroszlánrészét innentől az MPK csapata csinálja, ők értelmezik a Neticle mutatóit és egészítik azokat ki.

logo-vertical-medium.gif

Sz.A.: Ahogy eddig tapasztaltam a Véleményárfolyam egy soha véget nem érő projekt. Nem csak azért, mert újabb és újabb témák jönnek fel a politikai aktoroknak köszönhetően a kampány és a választások közeledtével, hanem mert a közös munka során folyamatosan finomhangoljuk a rendszer beállításait, hogy még pontosabb eredményeket kapjunk. De visszatérve a konkrét folyamatra, miután kitaláltuk a következő témát, amit kutatni szeretnénk, majd elkészült a szószedet és a srácok is beállították a rendszert, kezdődik a mi munkánk. Hónapról hónapra megnézzük az adatokat a politikai Véleményárfolyam esetében. A rendszer által vizualizált statisztikákat lementjük, majd megnézzük, hogy az adott hónapban mik voltak a leggyakoribb témák, vagy volt-e az átlagos folyamatoktól eltérő esemény. A havi értékekből készítünk egy PPT-t, amiben bemutatjuk, hogy minek köszönhető egy-egy politikai szereplő megítélésének kiemelkedő mértékű romlása, vagy javulása, mi lehet az oka annak, ha egy párt a korábbi alacsony említésgyakorisága egyik hónapról a másikra megugrik.

 

Manapság a legtöbb vitát Bollen és társai „More Tweets, More Vote” tanulmánya váltja ki, mely szerint a puszta említésgyakoriság szavazatokra váltható. Mi a helyzet a magyar politikával ezen a téren?

 

Sz.P.: Én ezen a téren azt látom, hogy a webes említésszáma a pártoknak összhangban van a közvéleménykutató cégek felméréseivel, persze pontosabb dolgot a választások után lehet és érdemes számolni. Látni kell, hogy az adataink egyértelműen mutatják, hogy a magyar weben vannak bizonyos véleménytrendek szakterületenként. Tehát például közéleti dolgokban elsősorban negatív vélemények jelennek többségében. De igaz ez a pénzügyi és más szolgáltató szektorokra is: a netezők inkább a kritikáikat, panaszaikat írják le. Ez azt is jelenti, hogy a Neticle véleményárfolyam változása, trendtörése az érdekes ezeken a területeken szakmai/üzleti szempontból, de például az alacsonyabb véleményárfolyam nem jelent feltétlenül kevesebb szavazatot vagy akár kevesebb eladást. Az említésgyakoriság természetesen jól mutatja egy brand erősségét, így egészen addig, amíg nem lesz Magyarországon is egy igazi netes kalóz vagy geek párt, addig igaz lesz véleményem szerint.

 

Sz.A.: A Véleményárfolyam eddig alapvetően nem cáfolta meg a közvélemény-kutatások eredményeit sőt, volt alkalom, hogy mi már előbb képesek voltunk jelezni egy párt népszerűségének emelkedését, mint a hagyományos közvélemény-kutatók. Ugyanakkor a Véleményárfolyam eredményiéből nem lehet és nem is szabad mandátumokat, vagy szavazatszámokat generálni, mert egész egyszerűen a rendszer nem erre lett kifejlesztve. Talán úgy jobban megfogható a kutatás lényege, ha egy fajta internetes vélemény-klíma kutatásként jellemezzük. Mi nem arra koncentrálunk, hogy ki fog nyerni, hanem arra, hogy bemutassuk mik voltak azok a témák, amiről a hazai internetes közösség beszélt, illetve, hogy ezeknek a témáknak a megítélése pozitív vagy negatív irányba változtatta a pártokkal és politikusokkal kapcsolatos véleményeket.

 

Minden jelentésben szinte folyamatosan negatív trendet mutat a véleményindex alakulása, ami ellentmond az említésgyakoriság híveinek, akik szerint nem érdemes szentimentet mérni, mivel a pollyanna miatt a magasabb említésszám valószínűleg pozitívabb véleményt is tükröz. A ti adataitok alapján lehet egyáltalán bármilyen kapcsolatot találni az említésgyakoriság és a WOI értékek között?

 

 

Sz.P.: Igen sokszor lehet látni, hogy egyes piacok elemeiről inkább negatívakat írnak a netezők (politika, internetszolgáltatás) míg másokról főleg pozitívat (autószektor, kozmetikumok). Az adataink alapján azt mondhatjuk, hogy piaci sajátosság és nem nyelvi sajátosság, hogy a magyar weben az említések száma és a véleményárfolyam hogyan korrelál.

 

Sz.A.: Az elmúlt nyolc hónap egyik egyértelmű eredménye, a már említett negatív trend a közélet és politika terén. Azonban véleményem szerint ettől nem kell kétségbe esniük sem a választóknak, sem pedig a politikusoknak. Nem szabad elfelejtenünk, hogy egy politikus és párt igazi halál akkor következik be, ha már nem is beszélnek róla. Az elsődleges cél tehát az interneten is az elsősorban az, hogy minél több említést generáljon az adott politikai szereplő, és csak ezt követi annak a fontossága, hogy ezek az említések lehetőség szerint pozitívak legyenek. Tapasztalataink alapján valóban szektora válogatja, hogy milyen jellegű a kapcsolat az említésgyakoriság és a WOI értékek között. A hazai internetezők közéletről alkotott megítélése azonban mindenesetre jelenleg negatív trendet mutat, ezt tudomásul kell venni és ebből az alapvetésből kell kiindulni a számok és folyamatok értékelése során.

 

A netes tartalmak elemzése alkalmas lehet (valamikor rövid- vagy középtávon) egy közvélemény-kutatás kiváltására és előrejelzésre?

 

Sz.P.: Szerintem itt nem beszélhetünk kiváltásról. A két dolog egyszerűen másra jó. A mi elemzéseink előnye, hogy nagyon gyors, és jóval olcsóbb megoldás egy klasszikus közvéleménykutatásnál. Tehát gyorsan lehet „durvább” adatokra szert tenni, kulcspontokat és trendeket feltárni. Például ahhoz, hogy megalapozzunk egy részletes és átfogó kutatást. Tisztában kell lenni a limitációkkal, módszertanilag nem tudja jelenleg a netes tartalmak elemzése helyettesíteni egy közvéleménykutatás mintavételét és alaposságát, hiszen elég csak arra gondolni, hogy a Facebook posztok milyen kis százaléka publikus. Illetve nagyon fontos, hogy egy kutatás célcsoportjának mekkora részéről mondható el, hogy megosztja vagy legalább megoszthatná a véleményét online.

vélemény.jpg

Sz.A.: Igen, azt mindképpen tisztáznunk kell, hogy a projekt nem a közvélemény-kutatások alternatívája, azok felváltója akar lenni, hanem egy fontos kiegészítő kutatás. Ha fel akarjuk tárni egy politikai botrány internetes dinamikáját, akkor a Véleményárfolyam alkalmas eszköz ennek elvégzésére. Az elmúlt hónapokban például kitűnően tudtuk szemléltetni azt, hogy napi szinten hogyan változott meg adott párt megítélése az adott üggyel kapcsolatban, vagy például hogyan rázott le magáról egy politikai közösség egy botrányt, hogy az szépen ráégjen egy másikra.  A projekt legnagyobb erénye pedig, és ezzel viszont egyértelműen felveszi a versenyt a hagyományos közvélemény-kutatásokkal, hogy míg egy telefonos lekérdezés esetében csak az aktuális preferenciákat, véleményeket lehet lemérni, addig mi a letárolt adatok alapján torzítatlanul vissza tudjuk utólag keresni akár decemberben is, hogy például márciusban milyen is volt egy adott ügy, vagy közéleti szereplő megítélése. Ez a klasszikus közvélemény-kutatások során lehetetlen, hiszen módszertanilag erősen megkérdőjelezhető lenne egy olyan kérdés decemberben, hogy „mondja kérem mit gondolt XY-ról márciusban, de kérem hagyja figyelmen kívül az azóta lezajlott eseményeket.”

 

Jönnek a választások, gondolom, egyre többen találják meg elemzéseiteket a neten. Milyen visszajelzéseket kaptok a „fogyasztóktól”?

 

Sz.P.: Mi elsősorban az oldallátogatások, megosztások és like-ok számának növekedésében látjuk ezeket a visszajelzéseket. Illetve több ismerősünk is jelezte, hogy mennyire jó, hogy készítünk ilyen vizsgálatokat, hiszen sokak szerint a jövőben a politikai kommunikáció is sokkal inkább web fókuszú lesz.

Sz.A.: Nagyon lassan kezdett el beszivárogni a közbeszédbe. Azonban most már elmondható a mi tapasztalataink alapján, hogy az elmúlt másfél-két hónapban robbanás szerű volt az érdeklődés. Mi elsősorban nem lájkok és megosztások alapján határoztuk meg a projekt sikerességét, hanem sokkal inkább a média megjelenéseket és hivatkozás számokat vesszük alapul. Ez alapján ahogy már említettem egyértelműen sikert értünk el az elmúlt időszakban, és ma már nem csak úgy jelenik meg a Véleményárfolyam, hogy mi belefűzzük egy-egy attól független témába, hanem több esetben is ennek a projektnek az okán hívtak el minket rádióba, tv-be.

mpk_elemzes_20131118.PNG

Készültök-e jövőre valami extrával a választásokra?

 

Sz.P.: Mivel több mint 1 évnyi elemzett adatunk lesz a területről akkorra, mindenképp érdemes lesz korrelációs és predikciós statisztikai vizsgálatokat csinálni, de itt az izgalmas az a tudás lesz, amivel a Méltányosság tudja majd interpretálni az adatokat, ahogy közelítünk a májushoz. Persze el tudok képzelni egy heti rendszerességű predikciós riportot , de erről még egyeztetnünk kell.

Sz.A.: Szerencsés a helyzetünk, hiszen 2013 februárjában tettük közzé a meltanyossag.hu-n az első politikai Véleményárfolyamot, így közvetlenül a választások előtt már egy évnyi adattal fogunk rendelkezni, amiből már sokall komplexebb és mélyebb elemzéseket fogunk tudni készíteni arról, hogy mi hogyan mozgatja meg a hazai internetet, ha közéleti témákról van szó.

 

Köszönjük Péternek és Andrásnak, hogy válaszoltak kérdéseinkre! Sok sikert kívánunk a Neticle és a Méltányosság egyedülálló együttműködésének!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr375690639

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.