Adatújságírásról szóló sorozatunk és az inkLink után sokakban merült fel, hogy miképp is vághatnának bele az adatújságírásba és/vagy adatelemzésbe. A legtöbb érdeklődőt az rettenti el, hogy azt hiszik, egyszerre kell programozóvá és statisztikussá válniuk. Ez azonban nem igaz! Az adatújságírás műveléséhez nincs szükség statisztikai képzettséghez és/vagy programozói diplomára. Simon Rogers, a The Guardian Datablog főszerkesztője szerint az adatújságírás az új punk mozgalom; mindenki művelheti. Alapvetően két fő összetevője van egy jó projektnek, adatok és egy eszköz ami segít az adatok mögé látni.
School of Data
Az Open Knowledge Foundation nemrég indította útjára a School of Data portált, ami rövid és mindenki számára érthető leckékben foglalja össze az alapokat, kezdve az adatok begyűjtésével és kitisztításával az összetettebb elemzésekig. Egy kis angoltudáson és egy elfogadható számítógépen és internetkapcsolaton kívül más nem is kell az alapok elsajátításához.
Adatelemző eszközök
Olyan ingyenesen használható eszközöket sorolunk fel, melyek általános digitális írástudáson kívül nem igényelnek más háttértudást.
- Google Fusion Tables - A Fusion Tables erőssége, hogy a Google Maps-en is könnyen megjeleníthetjük adatainkat segítségével.
- Tableau Public - A Fusion Tables-hez hasonló, de talán szebb megoldásokat produkáló eszköz. Az ingyenes változata is remekül használható, de lehetőség van előfizetni a szolgáltatásra ami sok bónusz eszközzel jár.
- Google Spreadsheets - A megszokott táblázatkezelőkhöz hasonló eszköz, használatával egyszerű grafikonokat készíthetünk.
- DataMarket - Sok adatot érhetünk el a DataMarket-en, ezek jelentős része ingyenes. Az adatokat rögtön meg is jeleníti a beépített ábrázoló eszköz.
- ManyEyes - Az első ingyenesen elérhető vizualizációs eszköz előnye, hogy sok felhasználó adatait és vizualizációit is böngészhetjük.
Hol az adat?
Nehéz felsorolni az összes adatforrást, de az alábbi helyek jó indulópontok.
- KSH - A Központi Statisztikai Hivatal oldalain rengeteg magyar vonatkozású adatot érhetünk el.
- Eurostat - Az EU szervezetei és a tagállamok statisztikai hivatalai egyaránt jelentenek a Eurostat-nak, így érdemes itt kezdeni a keresést, ha európai viszonylatban vagyunk kíváncsiak valamire.
- IMF - a Valutaalap nagyon jó pénzügyi és gazdasági statisztikákkal rendelkezik.
- ENSZ adatbank - Az ENSZ szervezeteinek adatait tartalmazó adatbank.
- DataMarket - részben ingyenes adatok is találhatók az oldalon. Nagy előnye, hogy egy helyen gyűjt össze különböző forrásokat.
Adat piac sorozatunkban bemutattuk a (részben) fizetős adatforrásokat is.
- Adat piac 1. rész - a Data Market és az InfoChimps bemutatása.
- Adat piac 2. rész - a Factual és az uberlic bemutatása.
- Adat piac 3. rész - a Kasabi és linked data adatforrások bemutatása.
További olvasnivalók:
- Simon Roger: Facts are Sacred - ez a rövid Kindle Single összefoglalja az adatújságírás történetét, bemutatja napjaink módszereit és eszközeit a legizgalmasabb kurrens projekteken keresztül. A Számítógépes nyelvészeten részletesen is ismertettük a kötetet.
- Simon Rogers: Anyone can do it. Data journalism is the new punk
- Simon Rogers: Data visualization DIY: our top tools