Az Institute for Research in the Social Sciences immár második alkalommal rendezte meg Computational Social Science konferenciáját, ennek YouTube csatornájáról szemezgettünk.
A "data science" vagy adattudomány napjaink egyik legdivatosabb szava IT körökben. Fontos azonban megjegyeznünk, hogy ez nem csupán a nagy mennyiségű adatok feldolgozásához szükséges infrastruktúrát és a statisztikát jelenti. Legalább annyira fontos az elméleti háttér is, hiszen az segít kérdéseket megfogalmazni és értelmezni a válaszokat. A társadalomtudományok számára a webkettes technológiák eddig soha nem látott mennyiségű adatot hoztak, melyek az adatfeldolgozás technikai megoldásain túl kutatásmódszertani kérdéseket is felvetettek. Ezek közül az egyik legjelentősebb az ún. terepkísérletek átültetése az online világra. A szinte minden statisztika tankönyvben fellelhető példa szerint, a francia falvakban a gólyafészkek száma és az újszülöttek száma között korreláció van. Egy bizonyos kor után szinte minden ember tudja, hogy nem a gólya hozza a babákat, ergo a korreláció nem jelent oksági (kauzális) kapcsolatot a két jelenség között. A gólyák és az újszülöttek esete egyszerűnek tűnik, de vannak sokkal bonyolultabb esetek is. Pl. a dohányzás és a daganatos megbetegedések megjelenése közötti viszony kimutatása nem volt éppen zökkenőmentes, de az afro-amerikaiak alacsony pontszámait az IQ-teszteken sokáig gazdasági hátterükkel korreláltatták míg rá nem jöttek, hogy a fehér középosztálybeli iskolázott férfiakra szabott kérdések rosszak. A kísérletek célja, hogy felfedje tényleg akad-e oksági kapcsolat ott, ahol korrelációt találunk, ill. rávilágítson az oksági lánc irányára. A CompSS előadásai laikusok számára is emészthető formában mutatják be mi mindenre jó az ilyen gondolkodás.
Jeff Heer: Interpretation and Trust
Jon Levin: Learning from Experiments in Online Markets
Hal Varian: Predicting the Present with Search Engine Data
Justin Grimmer: The Impression of Influence