Van egy kis földünk. Szeretnénk ültetni valami növényt, mert szeretjük a zöldet, azonban pesti DJ-k vagyunk. A barátnőnk anyjától meg tudjuk kérdezni, hogy az adott növényeket, hogy kell ültetni, metszeni stb. ezzel nincs is probléma. A probléma az, hogy a növényeknek igényeik vannak, a területeknek pedig adottságaik.
A földterületünk adott és ki kellene választani hozzá a megfelelő növényt. Ehhez adatokra van szükségünk. Adatokat kell gyűjtenünk a térség éghajlatáról, és egy ehhez passzoló növényt kell ültetnünk.
Ahhoz, hogy jó döntéseket hozzunk, hosszútávon jó stratégiát alakítsunk ki, a lehető legtöbb jó minőségű adatra van szükségünk. A továbbiakban két olyan szolgáltatást mutatunk be melyek segítenek könnyen megtalálni és elemezni a számunkra szükséges információt.
DataMarket
Először is nézzük a Datamarketet. Ha még nem regisztrált a látogató a "Sign up for free for full excess"-re kattintva pár másodperc alatt megteheti. Így három plusz szolgáltatás válik elérhetővé: a táblázatokat letölthetjük CSV (comma separated values, azaz vesszővel elválasztott értékek) formátumban, egyetlen kattintással megoszthatjuk pl. a kedvenc statisztikáinkat Facebookon, illetve beágyazhatjuk a számunkra érdekes grafikonokat a weboldalunkba. Azok akik ki szeretnék próbálni a többletszolgáltatásokat (pl. az Excel táblába exportálható adatokat), 30 napig ingyenesen megtehetik.
Nekünk különösen a CSV formátumba exportálás tetszett a Peat End-Use Statistics adathalmazon próbáltuk ki.
- Baloldalt kipipálgatjuk azokat az adatokat, amikre kiváncsiak vagyunk.
- Rákattintunk a "Visualize" gombra.
- A grafikon alatt az Export gomb megnyomása után kiválasztjuk a kívánt szeparátort "pontos-" vagy "sima" vessző
- Ezek után saját gépünkön dolgozhatunk az adatokkkal a nekünk kedves alkalmazással (pl. R, SPSS vagy Excel).
A további ingyenes szolgáltatások igénybevétele is hasonlóan egyszerű, az ábrák alatt lévő menüpontok segítségével egy két kattintással elérhetők. A fizetős szolgáltatásokért havi 59 dollárt kell fizetnünk.Ezért cserébe pl. PDF és PNG exportálási lehetőséget kapunk, és személyreszabhatjuk a Datamarket szolgáltatásunkat.
A Datamarket alapvetően egy hatalmas adatbánya, de az adatok kitermeléséhez csak egy csákányt meg egy sisakot ad. Azoknak tökéletes, akik vagy nem kívánnak nagytömegű adattal dolgozni és megelégednek belépőszintű szolgáltatásokkal vagy járatosak az adatok menedzselésében. Mindemelett, egyetemista hallgatók számára tökéletes játszótér: hasznos lehet az oldal, azok számára, akik érdekes statisztikákra kíváncsiak, vagy munkáikba/dolgozataikba kulturált megjelenésű grafikonokat szeretnének beszúrni. Továbbá az Excel és CSV formátumok exportálása révén lehetőség nyílik gyakorolni a fentebb említett R-t és más statisztikai programokat.
Infochimps
Az InfoChimps a DataMarket mögött álló cég. 2009 szeptemberi indulása óta 200 támogatót (többek között Twittert, Foursquare-t) és több, mint 10.000 ügyfelet szerzett magának a cég.
Amikor anno feltűntek az online office alkalmazások furcsamód nem lehetett találkozni online adatbázis kezelővel. Még a Google Apps szolgáltatásban se szerepel "GoogleAccess" vagy "GoogleDat". A Factual és az Infochimps tulajdonképpen ebbe a piaci résbe nyomult be gőzerővel. Az Infochimps esetében egy olyan platformról van szó, ami mindenki számára elérhetővé teszi azokat az eszközöket, amiket a cég a Datamarketen lévő adatok feldolgozásához használ. Fentebb a Datamarket szolgáltatásait a csákányhoz és sisakhoz hasonlítottam. Ha maradunk a hasonlatnál, akkor az Infochimps platformja kb. egy részecskegyorsító. A springsense Map/reduce rendszerével, a Runa Hadoop szolgáltatásval és elég komoly technológiai fegyvertárral felvértezve, az adatbázis menedzsment szolgáltatáson kívül az Infochimps segít az adatok hatékony elemzésében és szállításában. Az utóbbihoz az Apache Flume-ot és a sajátfejlesztésű Data Delivery Service-t használja.