A márciusi céges Hackathon egyik projektjeként azt a célt tűztük ki, hogy feltárjuk, milyen elemzési lehetőségek rejlenek a nyilvános Facebook oldalak adataiban. Emellett az is célunk volt, hogy mindezt a D3 JavaScript könyvtár segítségével jelenítsük meg vizuálisan. A Hackathon végére elkészült oldal itt nézhető meg.
Az elemzéshez két akkor aktuális esemény oldalát választottuk ki, a február 13-i tanártüntetését, amely során első ízben tüntettek a kormány oktatáspolitikája ellen, valamint a február 23-i Tüntetés a demokráciáért a Választási Irodánál! nevű eseményt, amelyet a Nemzeti Választási Irodában történt népszavazási kérelemmel kapcsolatos incidens után tartottak. A februári tanártüntetés eseményének oldala már nem érhető el.
Fotó: Szabó Gábor - Origo
A Facebook feedekről szöveges és numerikus adatokhoz egyaránt hozzájuthatunk. Ezeket három megközelítésben elemeztük:
1) Az aktivitás mérőszámainak, a like-ok, share-ek, kommentek és posztok számának vizsgálatára idősoros megjelenítést alkalmaztunk. Mindkét eseményhez két idősor készült, egy a nyers aktivitási értékekkel, egy pedig a posztok számával normalizált értékekre. Előbbi megjelenítésnél mindkét eseménynél az látszik, hogy a legnagyobb aktivitás a tüntetés napjához fűződik, utóbbinál azonban megfigyelhetők más kisebb-nagyobb hullámok is, amik a nagyobb aktivitást kiváltó posztokat jelzik.
2) A posztok és kommentek szövegeinek leggyakoribb szavaiból egyszerű szófelhők készültek, az ehhez tartozó rövid értelmezést még sikerült a Hackathon ideje alatt megírni.
3) A harmadik megközelítés a Facebook adatok struktúrája alapján eléggé adott hálózatos megjelenítés volt. A kész oldalra végül csak a tanártüntetés gráfja, sőt annak is csak egy kisebb részgráfja került fel, ugyanis akkora adatmennyiséggel volt dolgunk, ami vizuálisan már nem mutatott szépen. A hálózat csúcsai az esemény oldalán aktivitást kifejtő személyeket jelzik, a köztük lévő élek, azaz kapcsolatok pedig az egymás posztjaira, kommentjeire adott lájkokat jelentik. A gráfon így könnyen kiszúrhatjuk a centrális helyet elfoglaló szereplőket, akik az oldalon zajló diskurzus meghatározó személyeinek tekinthetők.
Az oldalra még ráférne egy-két simítás (pl. az egymás mellé helyezett idősorokon nem látszik az időpontokat jelző tengely, adatvédelmi szempontból a hálózat csúcsaihoz nem beazonosítható ID-t illene rendelni, valamint egyéb elrendezési szempontok), de tekintve, hogy nagyjából 5 óra alatt jutottunk el eddig, szép eredménynek könyvelhetjük el.