HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

A Clementine Consulting szöveganalitikai elemzőt keres

2014.01.24. 08:00 Szerző: Zoltán Varjú Címkék: állás szövegbányászat Clementine Consulting

A Clementine Consulting szöveganalitikai elemzőt keres, bővebben a pozícióról itt. Nyelvtechnológiában jártas nyelvészek, infósok, közgázosok, társadalomtudományi és természettudományos szakemberek számára ideális pozíció!

clementine.PNG

A Clementine Consulting (korábbi nevén SPSS Hungary) az IBM premier szintű üzleti és support partnere. Az ismert statisztikai programcsomag mellé olyan innovatív megoldásokat fejlesztett, mint pl. a CLEMTEXT magyar nyelvű kivonatoló eszköz és a hang-, szöveg- és adatbányászati eszközöket integráló CLEMVOICE rendszer. Új munkatársuk minden bizonnyal izgalmas szakmai feladatok elé néz!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Big Data + Search - Big Data Meetup 2014. február 12.

2014.01.20. 10:00 Szerző: Zoltán Varjú Címkék: meetup Hadoop Precognox Big Data

A Big Data Meetupot Arató Bence indította útjára még 2013-ban. A Bencétől megszokott magas színvonalon (pl. Budapest BI Forum) a Big Data metupon neves külföldi és hazai szakemberektől értesülhetnek a terület aktualitásairól az érdeklődök minden hónapban. Az idei első találkozó február 12-én kerül megrendezésre, témája pedig a keresés, amiről Wolfgang Hoschek a Cloudera Search Team tagja, Szász Barnabás és Borbély Tibor a National Instruments-től valamint Kása Károly a Precognox fejlesztési vezetője fog tartani egy-egy előadást. A meetup ingyenes, de a részvétel előzetes regisztrációhoz kötött (a helyek száma korlátozott, de érdemes a várólistára feliratkozni).

big_search.jpeg

Finding a needle in a stack of needles - adding Search to the Hadoop Ecosystem 
Apache Hadoop is enabling organizations to collect larger, more varied data - but after it's collected how will it be found? Your users expect to be able to search for information using simple text based queries -- regardless of data location, size, and complexity.How do they quickly find information that's just been created, or been stored for months or even years? 

Cloudera Search Engineer Wolfgang Hoschek will present their solution to this problem; what architecture is necessary to search HDFS and HBase? How was Apache Solr, Lucene, Flume, MapReduce, HBase and Morphlines integrated to allow for Near Real Time and Batch indexing of documents? What are the solved problems and what's still to come? Join us for an exciting discussion on this new technology.

 

Speaker: Wolfgang Hoschek, Cloudera 
Wolfgang is a Software Engineer on the Platform and Cloudera Search team. He is a committer on the Apache Flume and Apache Lucene/Solr projects, a committer on the Kite project and the lead developer on Morphlines. He is a former CERN fellow and former Computer Scientist at Lawrence Berkeley Lab. He has 15+ years of experience in large-scale distributed systems, data intensive computing and real time analytics. He received his Ph.D from the Technical University of Vienna, Austria.

 

Hadoop based ETL and Solr based semantic search behind Jobmonitor.hu 
This talk will discuss how Hadoop and Solr is used to power the Hungarian job search site Jobmonitor.hu

 

Speaker: Károly Kása, Precognox 
Károly is the development manager at Precognox, the semantic search and text mining specialist company.

 

Search based user experience 
Quick introduction to how National Instruments powers it’s web presence with Attivio (AIE) search engine based user experience. The talk will present how content is being pushed to the search index with a custom document enrichment process and what are the challenges. 

Speakers: Barnabas Szasz, IT Manager for Search, CMS, eCRM at National Instruments and Tibor Borbely, Senior Programmer Analyst, Enterprise Search at National Instruments 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Context is King : A kontextus mindent visz

2014.01.17. 08:00 Szerző: Kereso75 Címkék: mobil kontextus

A kontextus már ma is sokszor elérhető és pontosítható, használatával pedig minőségibb mobilos szolgáltatásokat lehet építeni. Léteznek eszközök, kezdjétek el használni őket, még ha pontosan nem is látszik először, hogyan lehetne őket hasznosítani! Ahogy Tony Stark mondta, Sometimes you gotta run before you can walk! Nézzük pár példát a kontextus használatára!

 

Az élet telis-tele van kétértelműséggel

1213 őszén magyar főurakból álló csoport merényletet hajtott végre II. András felesége, Gertrúd ellen. A felkelés oka, hogy öccsét, Ottót kalocsai érsekké akarta kinevezni. Petur bán és az ország nádora, Bánk bán a merénylet előtt kikérték az esztergomi érsek, Merániai János tanácsát. A főpap két tűz közé került. Egyrészt Ottó kinevezése veszélyeztette a főpapi rangját és minden más kiváltságát. Előnyös lett volna a felkelők közé állnia. Másrészt a gyilkosságban való részvételért nemcsak magas rangját, de életét is elvesztette volna. Így hát azt tette, ami miatt a politikusok védőszentté is avathatnák: megalkotta híressé vált kétértelmű válaszát:

  • Reginam occidere nolite timere bonum est si omnes consentiunt ego non contradico

Melynek két olvasata is lehetséges:

  • A királynét megölni nem kell, félnetek jó lesz, ha mindenki egyetért, én nem, ellenzem
  • A királynét megölni nem kell félnetek, jó lesz, ha mindenki egyetért, én nem ellenzem.

Persze a szituációnak megfelelő olvasatot választotta később János, azaz az ellenzőt, s ezzel tisztázta is magát (bővebben l. a Wikipedia vonatkozó szócikkét). Számunkra a lényeg az, hogy jelentést nem olyan könnyű csak a szavak egymás utániságából megállapítani. Ez régen volt, de ma is találkozunk hasonló esetekkel, akár a mindennapokban.

man_hoovering_main.jpg

Egy családban gyakran szegezi a feleség férjének a kérdést: „Nem szeretnél felporszívózni?” A naiv férj azt gondolná az a mondat kérdő, esetleg óhajtó. Rossz válasz… Ez általában annyit tesz; porszívózz fel! Legalábbis, ha az embert a párja kérdezi otthon. De jelentheti azt is, hogy „Én mosogatok, te pedig porszívózhatsz.” A legritkább esetben jelenti azt, hogy „Ha éppen van kedved és szeretnél, akkor porszívózhatsz”. De legyünk tudományosak: a fenti mondat alapvetően nem eldöntendő kérdés, az elsődleges nyelvtani jelentés ellenére. Mondhatjuk úgy is, hogy a szemantikát a kontextus határozza meg. A jelentést a szövegkörnyezet nagyban befolyásolja. Hogy mikor mit jelent egy mondat, egy cselekvés, egy keresőkérdés, azt a kontextus pontosítja – ki, mikor, hol, hogyan és milyen körülmények között mondja.

 

Context is King – a kontextus minden

Context-is-king-1024x768.jpg

A fenti példákkal arra szerettünk volna rávilágítani, hogy mikor mit jelent egy mondat, egy cselekvés, egy keresőkérdés, azt a kontextus pontosítja – ki, mikor, hol, hogyan és milyen körülmények között mondja. Ha kereséssel foglalkozol, ezt semmiképpen nem hagyhatod figyelmen kívül. Van azonban két nagyszerű hírünk: 1) a kontextus nem csak a keresésnél fontos, hanem sok más mobilalkalmazás fejlesztésénél, 2) soha ennyit nem tudtunk arról, aki a szoftverünket használja, mint a mobilok korában. A telefon szenzorai segítenek nekünk megtalálni a kontextust, ami ezért minden mobilalkalmazás esetében felmérhető.

 

Tudom, mit teszel jövő nyáron

bal.jpg

Barabási Albert László kutatásai óta mást is tudunk. Leírta, hogy egy mobil mozgását az időben kellő ideig figyelve 90% feletti valószínűséggel megmondható, hogy hol lesz az adott mobilkészülék a közeljövő egy időpontjában - persze a tulajdonosával együtt. Mondhatnánk, hogy a telefon adott esetben nem csak azt tudja, hol vagyok, de azt is, hová akarok menni….

brain.jpg

Nagyon nagy előrelépés mindez. A keresés alapvető problémája és legrégibb kérdéseink egyikére ad legalább részleges választ. A keresők azért nem tudnak jobb választ adni a kérdéseinkre, mert nem ismerik a szándékunkat abban a pillanatban, amikor a kérdésünket megfogalmazzuk. Egy zárt rendszer agyunk a keresőrendszer számára ilyen szempontból. Ugyanazon keresési kifejezés más és más jelentést hordozhat a fejünkben, ahová egyelőre a számítógép nem igazán lát be. Vagy nem látott be eddig. A mobilunk annyi mindent tudhat rólunk, hogy kinyitja ezt a kaput.

 

Az ember és gép közötti kommunikációval foglalkozók válasza erre a problémára a kontextus! A mobileszközök és egyébként a közösségi oldalak is óriási előrehaladást jelentenek. A Facebook új keresőjét, a Graph Search-öt talán már a legtöbben használatba vettük. Elsőre nem tűnik nagy újdonságnak, de természetes nyelven tehetünk fel kérdéseket neki - és a kontextust is igyekszik megtalálni! Ha arra vagyok kíváncsi, mely miskolci éttermeket kedvelték ismerőseim, akkor kilistázza azokat, melyeket barátaim lájkoltak. Ha nincs az adott térségben ismerősöm, vagy nincs Facebook oldallal rendelkező étterem, akkor a Bing kereső találatait listázza a rendszer. Azaz a kontextus itt a helyzetem és az ismerősi köröm.

 

 

Természetesen a közösségi kapcsolatok kontextus pontosító ereje, nem csak a felhasználóknak, de a hirdetőknek is nagyon fontos. Nem véletlen tehát a Google+ pluszt életben tartó buzgalom. Még akkor is, ha a Google+ ma még mindig leginkább olyan, mint az otthoni fitneszgépek: Mindenkinek van, de senki sem használja.

google_hummingbird-580x334-2.jpg

A Google kereső legújabb Hummingbird updateje is ezt célozza. Minden hipochonder álma egy orvos ismerős. De ha jogi gondunk akad, szeretnénk gyorsan találni egy ismerős ügyvédet, aki válaszolna a kérdésünkre. Kedvenc hentesünk véleményét kérjük ki, hogy jó steaknek való húst szerezzünk be. A szakértők sajátos szótárat használnak és ismerik a szakszavak közötti hierarchiát. A keresőtől egyre inkább azt várjuk el, hogy ilyen szakértő tanácsadó legyen; lefordítsa a mi naiv szótárunkat az általa ismert hierarchiába és releváns választ adjon "civil" kérdésünkre. A Google frissítés nem csak megtalálja egy tartalom témáit, de ismeri az azok közötti hierarchiát is a Knowledge Graph-nak köszönhetően.

 

Ha a keresőben keresünk, és kapunk mondjuk 1 millió találatot, felmerülhet a kérdés. Most akkor a keresés után vagyok tényleg? Vagy még előtte? A Google újításai pontosan arra utalnak, hogy

  • egyre inkább válaszokat akar adni. Mobilon mindenképpen ez a cél. A kereső itt szinte biztos, hogy nem kutatni akar, hanem megoldást keres az aktuális problémájára.
  • a Google Now-hoz hasonlóan ki akarja szolgálni a felhasználót, a lehető legkevesebb, de legfontosabb információval.

A kontextus jó használata pontosan ezt segíti. A cél az, hogy minél kevesebb, de aktuális információt mutassunk. Legyünk minél fókuszáltabbak!

 

Arra is van már példa, hogyan keressünk lokációs alapon a közösségi médiában, a Geofeedia erre tesz kísérletet. Az alkalmazás segítségével gyorsan lehet területi alapú szűrést végezni több közösségi oldalon. Különösen hasznos, ha egy adott terület történéseit követjük, gondoljunk itt például a Twitter-forradalmakra.

 

Mi is készítettünk egy teszt kereső alkalmazást Android tabletre, amit beszéddel lehet vezérelni a Nuance eszközeit használva, és a Cylex cégadatbázisában keres. Az app megismeri a lokációs rövidítéseket, tehát segít eldönteni, hogy pl. Újlak Abaújlak vagy Alsóújlak akar-e lenni. Egyszerűen a közelebbi. Természetes nyelven lehet feltenni a kérdéseket neki, pl. hol van jó pizza Kaposváron? De mondhatom neki azt is, hogy „szállásra van szükségem a környéken” és megadja a szükséges információkat.

 

Lokáció alapú keresőt készít a magyarországi ESRI GiSearch, amely a weboldalakat járva helyinformációkat próbál összegyűjteni az adott oldalhoz kapcsolódóan és aztán azt használja fel a keresésnél.

page3.png

A jövő

Bár az előrejelzés nehéz dolog, különösen, ha a jövőről van szó. Mégis néhány gondolat a végén arról, mit hozhat a közeljövő:

  • A felismert kontextus részévé válthat az érzelem. Az arckifejezésre, vagy a nyelvhasználatra alapozva.
  • Felmerülhet a környezet monitorozása a háttérzajra alapozva főleg, mivel a képi információ felhasználása a személyiségi jogok miatt problematikus. Nem elég tudni például, hogy valaki a VAM Design Centerben van! Más a kontextus, ha valaki éppen egy előadást hallgat, s más, ha annak szünetében használja a telefonját.
  • De monitorozható lenne az asztmásoknál a légzés, vagy éppen egy súlyosan depressziós ember hanghordozása. Jelezve ezzel, ha a probléma azonnali beavatkozást igényel.
  • A beépíthető szenzorok száma szinte végtelennek látszik. Az iphone 5s-be ujjlenyomat szenzor került, de van már vérnyomás, vagy éppen EKG mérős szenzor is telefonhoz.
  • De fontos szempont lehet, a felhasználó mozgása is – állunk vagy mozgunk éppen? Milyen gyorsan mozog a felhasználó? Vonaton, buszon több információt adhatunk neki, de aki éppen gyalog keresi a legközelebbi postát, annak csak azt kell tudni, hogy balra vagy jobbra kell kanyarodnia éppen…

Az eszközök már adottak ahhoz, hogy a kontextust is megszerezzük. Azonban még nem igazán tudjuk ezeket használni, ezért kell sokat próbálkozni.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A Precognox nyelvész gyakornokokat keres!

2014.01.09. 08:00 Szerző: Zoltán Varjú Címkék: nyelvészet gyakorlat Precognox

A Precognox budapesti vagy kaposvári irodájába keresünk nyelvész gyakornokokat, távmunka is lehetséges. Elsősorban elméleti nyelvészet szakos hallgatókat (BA, MA, PhD szinten) keresünk, de a határterületek hallgatóit (informatika, matematika, fizika, kognitív tudományok, nyelvszakok stb.) is szívesen látjuk (nyelvészet, nyelvtechnológia, informatika minor náluk előnyt jelent). Jelentkezz ha szereted a kihívásokat, nem félsz a statisztikától, az R és/vagy a Python nem áll távol tőled - nem programozókat keresünk, nyugi!  

precognox_logo_OK.jpg

Informatikus gyakornokainkkal készítettünk beszédfelismerős cégkeresőt, több más projekt mellett. Korábbi nyelvész gyakornokunk munkájáról pedig itt olvashatsz. Ha szeretnél te is hasonló projekteken velünk dolgozni, akkor töltsd ki ezt a jelentkezési lapot!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Politikai véleményárfolyam - avagy miről beszél az internet népe?

2013.12.18. 08:00 Szerző: Zoltán Varjú Címkék: vendég nyelvtechnológia Neticle Méltányosság szentimentelemzés Politikai véleményárfolyam

Lassan egy éve indult útjára a Neticle Technologies és a Méltányosság Politikaelemző Központ Politikai Véleményárfolyam elemzése, ami világviszonylatban is egyedülálló. Legjobb tudomásunk szerint nincs más hasonló, rendszeresen megjelenő, internetes tartalmakra alapozott, mindenki számára hozzáférhető elemzés. Ahogyan arról többször beszámoltunk blogunkon, a közösségi tartalmakra alapozott elemzések és előrejelzések egyre népszerűbbek, de ezek többsége egy-egy eseményhez kötődik (pl. Bollen és tsai az Egyesült Államok 2008-as elnökválasztását, Jungherr pedig a 2009-es németországi választásokat vizsgálta), ezért úgy gondoltuk, a Szekeres Péter a Neticle vezető kutatójához és Szakács Andráshoz a Méltányosság elemzőjéhez fordulunk, hogy egyedülálló tapasztalataik alapján egy kicsit jobban el tudjunk igazodni a területen.

neticle_logo.png

Ritka, amikor egy technológiai cég és egy hagyományos elemzőközpont működik együtt. Röviden bemutatnátok magatokat és mesélnétek a nagy találkozásról, ami után elindult a Politikai Véleményárfolyam?

 


szp_1.jpgSz.P.: A Neticle Technologies egy magyar startup, amit azzal a céllal hoztunk létre 2 évvel ezelőtt, hogy webes szövegek automatikus elemzésével csináljunk izgalmas dolgokat. A Neticle nevű szoftverünkkel össze tudjuk gyűjteni közel valós időben a publikus magyar nyelvű szövegeket  a webről (cikkeket, blogokat, fórum és közösségi oldal bejegyzéseket), és ezeket automatikusan véleményelemezzük is. Így jön létre a véleményárfolyam nevű saját mutatónk, ami tulajdonképpen megmutatja a webes hangulat alakulását amire csak szeretnénk: márkákra, cégekre, személyekre, stb.

 

velemenyarfolyam.pngA Neticle véleményárfolyam azt mutatja meg, hogy egy adott időszakban hogyan alakul adott kulcsszó (vagy kulcsszavak) megítélése a magyar weben. A rendszer úgy kalkulálja a véleményárfolyamot, hogy összeadja folyamatosan az említések véleményindexét. A véleményárfolyam hasonlóan értelmezhető, mint a részvényárfolyam: az emelkedése az internetezők pozitív hangulatát, míg csökkenése az internetezők negatív hangulatát fejezi ki a kulcsszóval kapcsolatban.

 

 

A Méltányosságos srácokkal való megismerkedést a blog egyik szerzőjének, Varjú Zolinak köszönhetjük, remek kapcsolat alakult ki a politikai szakértői csapattal. Nagyon fontos volt, hogy már az elején láttuk, hogy nyitottak az újdonságokra, és hamar átlátták, hogy mit tud és mit nem tud a rendszerünk, és hogyan lehetne ezt elemzési és politikai tudással egy új és érdekes elemzési sorozattá alakítani.  Az eltelt idő alatt pedig  több olyan visszajelzés is érkezett a csapattól, amiknek köszönhetően sokat fejlődött a Neticle.

 



szakacs_andras_1.jpgSz.A.: A Méltányosság Politikaelemző Központ egy olyan professzionális politikaelemző intézet, mely a nagy múltú, nyugati agytrösztök nyomdokain kíván haladni. Politikakutatásokat, gyorselemzéseket, felméréseket, prognózisokat és átfogó szakpolitikai elemzéseket végez.  Központi témánknak a hazai kohézió kutatást választottuk, amelyről fájóan kevés szakmai anyag és tudományos kutatás született a rendszerváltás óta, pedig – ahogy azt már Európában felismerték – ennek a kérdése az, ami választ adhat egy-egy nemzet, vagy közösség sikereire, vagy sorozatos kudarcaira. Évek óta az érdekel bennünket, hogy hogyan lehetne a politikáról való gondolkodást egy kicsit kimozdítani a megszokott dagonyázás keretei közül. A Neticle volt az a cég, ami létrehozta azt az eszközt – a Véleményárfolyam formájában – amivel közösen képesek vagyunk erre. Jelenleg napi kapcsolatban állunk és zökkenőmentes az együttműködés, hiszen bármilyen új ötlet, vagy hibajavítás nem csak meghallgatásra talál, de meg is valósul rövid időn belül. Számunkra is fontos tanulság, hogy mennyire jól össze tud dolgozni két olyan cég, amely között hagyományos értelemben – de legfőképp a hazai viszonyok között - csak minimális mennyiségű közös pont található. Úgy gondolom az elmúlt egy évben sikerült összecsiszolódnunk és jól kiegészítjük egymást a közös projektben.

 

Hogyan képzeljük el az egyes jelentések elkészítését?

 

Sz.P.: A mi munkánk akkor volt jelentősebb, amikor beállítottuk a figyelt kulcsszavakat, tehát a pártok és elemzett személyek neveit. Itt feltártuk az írásmódokat, szinonimákat és ami ezen a területen különösen a releváns lehet, a nezetők által használt gúnyneveket (pl.: cucialisták, jaffások).  Persze ebben is sok segítséget kaptunk a Méltányosságtól. Itt hasznos volt nagyon például a Jobbik kulcsszónál, hogy megkülönböztetünk kisbetűt és nagybetűt a kulcsszó szinonimáknál, és csak az lesz találat, amely szövegben pontos egyezés van valamelyik kulcsszó szinonimával. Emiatt például kicsit komplexebb nálunk egy kulcsszó létrehozása mint egy Google keresés, de cserébe nagyon pontos találatokat kapunk.

szinonimak.png

Ezt követően a Neticle csapat elsősorban a véleményelemzési algoritmusunk szótárait finomítja saját tesztelés vagy éppen a Méltányosság visszajelzései alapján. A rendszerünk egy úgynevezett saját szemantikus mátrix szerint próbál felismerni akár sok szavas kifejezéseket, ezek elemeit folyamatosan finomhangoljuk, hogy minél pontosabb legyen a dolog. A rendszeres elemzések oroszlánrészét innentől az MPK csapata csinálja, ők értelmezik a Neticle mutatóit és egészítik azokat ki.

logo-vertical-medium.gif

Sz.A.: Ahogy eddig tapasztaltam a Véleményárfolyam egy soha véget nem érő projekt. Nem csak azért, mert újabb és újabb témák jönnek fel a politikai aktoroknak köszönhetően a kampány és a választások közeledtével, hanem mert a közös munka során folyamatosan finomhangoljuk a rendszer beállításait, hogy még pontosabb eredményeket kapjunk. De visszatérve a konkrét folyamatra, miután kitaláltuk a következő témát, amit kutatni szeretnénk, majd elkészült a szószedet és a srácok is beállították a rendszert, kezdődik a mi munkánk. Hónapról hónapra megnézzük az adatokat a politikai Véleményárfolyam esetében. A rendszer által vizualizált statisztikákat lementjük, majd megnézzük, hogy az adott hónapban mik voltak a leggyakoribb témák, vagy volt-e az átlagos folyamatoktól eltérő esemény. A havi értékekből készítünk egy PPT-t, amiben bemutatjuk, hogy minek köszönhető egy-egy politikai szereplő megítélésének kiemelkedő mértékű romlása, vagy javulása, mi lehet az oka annak, ha egy párt a korábbi alacsony említésgyakorisága egyik hónapról a másikra megugrik.

 

Manapság a legtöbb vitát Bollen és társai „More Tweets, More Vote” tanulmánya váltja ki, mely szerint a puszta említésgyakoriság szavazatokra váltható. Mi a helyzet a magyar politikával ezen a téren?

 

Sz.P.: Én ezen a téren azt látom, hogy a webes említésszáma a pártoknak összhangban van a közvéleménykutató cégek felméréseivel, persze pontosabb dolgot a választások után lehet és érdemes számolni. Látni kell, hogy az adataink egyértelműen mutatják, hogy a magyar weben vannak bizonyos véleménytrendek szakterületenként. Tehát például közéleti dolgokban elsősorban negatív vélemények jelennek többségében. De igaz ez a pénzügyi és más szolgáltató szektorokra is: a netezők inkább a kritikáikat, panaszaikat írják le. Ez azt is jelenti, hogy a Neticle véleményárfolyam változása, trendtörése az érdekes ezeken a területeken szakmai/üzleti szempontból, de például az alacsonyabb véleményárfolyam nem jelent feltétlenül kevesebb szavazatot vagy akár kevesebb eladást. Az említésgyakoriság természetesen jól mutatja egy brand erősségét, így egészen addig, amíg nem lesz Magyarországon is egy igazi netes kalóz vagy geek párt, addig igaz lesz véleményem szerint.

 

Sz.A.: A Véleményárfolyam eddig alapvetően nem cáfolta meg a közvélemény-kutatások eredményeit sőt, volt alkalom, hogy mi már előbb képesek voltunk jelezni egy párt népszerűségének emelkedését, mint a hagyományos közvélemény-kutatók. Ugyanakkor a Véleményárfolyam eredményiéből nem lehet és nem is szabad mandátumokat, vagy szavazatszámokat generálni, mert egész egyszerűen a rendszer nem erre lett kifejlesztve. Talán úgy jobban megfogható a kutatás lényege, ha egy fajta internetes vélemény-klíma kutatásként jellemezzük. Mi nem arra koncentrálunk, hogy ki fog nyerni, hanem arra, hogy bemutassuk mik voltak azok a témák, amiről a hazai internetes közösség beszélt, illetve, hogy ezeknek a témáknak a megítélése pozitív vagy negatív irányba változtatta a pártokkal és politikusokkal kapcsolatos véleményeket.

 

Minden jelentésben szinte folyamatosan negatív trendet mutat a véleményindex alakulása, ami ellentmond az említésgyakoriság híveinek, akik szerint nem érdemes szentimentet mérni, mivel a pollyanna miatt a magasabb említésszám valószínűleg pozitívabb véleményt is tükröz. A ti adataitok alapján lehet egyáltalán bármilyen kapcsolatot találni az említésgyakoriság és a WOI értékek között?

 

 

Sz.P.: Igen sokszor lehet látni, hogy egyes piacok elemeiről inkább negatívakat írnak a netezők (politika, internetszolgáltatás) míg másokról főleg pozitívat (autószektor, kozmetikumok). Az adataink alapján azt mondhatjuk, hogy piaci sajátosság és nem nyelvi sajátosság, hogy a magyar weben az említések száma és a véleményárfolyam hogyan korrelál.

 

Sz.A.: Az elmúlt nyolc hónap egyik egyértelmű eredménye, a már említett negatív trend a közélet és politika terén. Azonban véleményem szerint ettől nem kell kétségbe esniük sem a választóknak, sem pedig a politikusoknak. Nem szabad elfelejtenünk, hogy egy politikus és párt igazi halál akkor következik be, ha már nem is beszélnek róla. Az elsődleges cél tehát az interneten is az elsősorban az, hogy minél több említést generáljon az adott politikai szereplő, és csak ezt követi annak a fontossága, hogy ezek az említések lehetőség szerint pozitívak legyenek. Tapasztalataink alapján valóban szektora válogatja, hogy milyen jellegű a kapcsolat az említésgyakoriság és a WOI értékek között. A hazai internetezők közéletről alkotott megítélése azonban mindenesetre jelenleg negatív trendet mutat, ezt tudomásul kell venni és ebből az alapvetésből kell kiindulni a számok és folyamatok értékelése során.

 

A netes tartalmak elemzése alkalmas lehet (valamikor rövid- vagy középtávon) egy közvélemény-kutatás kiváltására és előrejelzésre?

 

Sz.P.: Szerintem itt nem beszélhetünk kiváltásról. A két dolog egyszerűen másra jó. A mi elemzéseink előnye, hogy nagyon gyors, és jóval olcsóbb megoldás egy klasszikus közvéleménykutatásnál. Tehát gyorsan lehet „durvább” adatokra szert tenni, kulcspontokat és trendeket feltárni. Például ahhoz, hogy megalapozzunk egy részletes és átfogó kutatást. Tisztában kell lenni a limitációkkal, módszertanilag nem tudja jelenleg a netes tartalmak elemzése helyettesíteni egy közvéleménykutatás mintavételét és alaposságát, hiszen elég csak arra gondolni, hogy a Facebook posztok milyen kis százaléka publikus. Illetve nagyon fontos, hogy egy kutatás célcsoportjának mekkora részéről mondható el, hogy megosztja vagy legalább megoszthatná a véleményét online.

vélemény.jpg

Sz.A.: Igen, azt mindképpen tisztáznunk kell, hogy a projekt nem a közvélemény-kutatások alternatívája, azok felváltója akar lenni, hanem egy fontos kiegészítő kutatás. Ha fel akarjuk tárni egy politikai botrány internetes dinamikáját, akkor a Véleményárfolyam alkalmas eszköz ennek elvégzésére. Az elmúlt hónapokban például kitűnően tudtuk szemléltetni azt, hogy napi szinten hogyan változott meg adott párt megítélése az adott üggyel kapcsolatban, vagy például hogyan rázott le magáról egy politikai közösség egy botrányt, hogy az szépen ráégjen egy másikra.  A projekt legnagyobb erénye pedig, és ezzel viszont egyértelműen felveszi a versenyt a hagyományos közvélemény-kutatásokkal, hogy míg egy telefonos lekérdezés esetében csak az aktuális preferenciákat, véleményeket lehet lemérni, addig mi a letárolt adatok alapján torzítatlanul vissza tudjuk utólag keresni akár decemberben is, hogy például márciusban milyen is volt egy adott ügy, vagy közéleti szereplő megítélése. Ez a klasszikus közvélemény-kutatások során lehetetlen, hiszen módszertanilag erősen megkérdőjelezhető lenne egy olyan kérdés decemberben, hogy „mondja kérem mit gondolt XY-ról márciusban, de kérem hagyja figyelmen kívül az azóta lezajlott eseményeket.”

 

Jönnek a választások, gondolom, egyre többen találják meg elemzéseiteket a neten. Milyen visszajelzéseket kaptok a „fogyasztóktól”?

 

Sz.P.: Mi elsősorban az oldallátogatások, megosztások és like-ok számának növekedésében látjuk ezeket a visszajelzéseket. Illetve több ismerősünk is jelezte, hogy mennyire jó, hogy készítünk ilyen vizsgálatokat, hiszen sokak szerint a jövőben a politikai kommunikáció is sokkal inkább web fókuszú lesz.

Sz.A.: Nagyon lassan kezdett el beszivárogni a közbeszédbe. Azonban most már elmondható a mi tapasztalataink alapján, hogy az elmúlt másfél-két hónapban robbanás szerű volt az érdeklődés. Mi elsősorban nem lájkok és megosztások alapján határoztuk meg a projekt sikerességét, hanem sokkal inkább a média megjelenéseket és hivatkozás számokat vesszük alapul. Ez alapján ahogy már említettem egyértelműen sikert értünk el az elmúlt időszakban, és ma már nem csak úgy jelenik meg a Véleményárfolyam, hogy mi belefűzzük egy-egy attól független témába, hanem több esetben is ennek a projektnek az okán hívtak el minket rádióba, tv-be.

mpk_elemzes_20131118.PNG

Készültök-e jövőre valami extrával a választásokra?

 

Sz.P.: Mivel több mint 1 évnyi elemzett adatunk lesz a területről akkorra, mindenképp érdemes lesz korrelációs és predikciós statisztikai vizsgálatokat csinálni, de itt az izgalmas az a tudás lesz, amivel a Méltányosság tudja majd interpretálni az adatokat, ahogy közelítünk a májushoz. Persze el tudok képzelni egy heti rendszerességű predikciós riportot , de erről még egyeztetnünk kell.

Sz.A.: Szerencsés a helyzetünk, hiszen 2013 februárjában tettük közzé a meltanyossag.hu-n az első politikai Véleményárfolyamot, így közvetlenül a választások előtt már egy évnyi adattal fogunk rendelkezni, amiből már sokall komplexebb és mélyebb elemzéseket fogunk tudni készíteni arról, hogy mi hogyan mozgatja meg a hazai internetet, ha közéleti témákról van szó.

 

Köszönjük Péternek és Andrásnak, hogy válaszoltak kérdéseinkre! Sok sikert kívánunk a Neticle és a Méltányosság egyedülálló együttműködésének!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása