A gazdasági élet szereplőit izgatja a jövő, hiszen szeretnek előre tervezni. Ezért rendkívül népszerűek, az olyan viszonylag egyszerű jelentések, melyek a vásárlói hangulatot (szentiment néven is szokták ezt emlegetni, de nem tévesztendő össze a nyelvtechnológiában használatos szentimentelemzéssel!) vizsgálják, hiszen ez egész jól leképezi a potenciális vásárlók költési szándékait. Az automatikus pénzügyi kereskedelmi platformokba is gyakran építik be ezeket. Eddig bevett gyakorlat volt, hogy a tréderek fizettek, hogy a hivatalos közzététel előtt kapják meg ezen adatokat, azonban a New York-i bíróság ítéletében eltörölte ennek lehetőségét. Ezért a szakma most keresi annak lehetőségét, hogy hasonló indexeket állítson elő online szövegekre és a közösségi médiában található tartalmakra alapozva. Ebben a posztban megvizsgáljuk, hogy mennyire lehetséges ez és milyen kihívásokkal kell szembesülnie annak, aki hasonló indexek előállítására adja a fejét.
R-Word Index - hírekre alapozott gazdasági előrejelzés
A The Economist és a The Economist Intelligence Unit régóta jelen van a gazdasági elemzések piacán. Leghíresebb gazdasági indexük az ún. Big Mac Index, ami az elterjedt hamburger ára alapján hasonlítja össze a különböző valuták túl- ill. alulértékeltségét. Hasonlóan egyszerű és érthető, ám sajnos kevésbé ismert a csoport R-Word Indexe (vagy más néven Recession Index). Ez a Washington Post és a New York Times cikkeiben méri a "recession" (recesszió) szó előfordulását. Az index viszonylag jól teljesít, 1981-ben, 1990-ben, 2001-ben és 2008-ban is jelezte a válság közeledését, de 1991-ben továbbra is válságot jelzett miután már hivatalosan elmúlt a recesszió. Az index népszerű, hiszen egyszerű mint egy faék, de könnyen előállítható és két olyan sajtótermékre alapozták ami a döntéshozók és a vásárlók várakozásait nagyban alakítja.
A Michigan Consumer Sentiment Index - a fogyasztói hangulatindexek őse
A University of Michigan Consumer Sentiment Index néven kiadott havi jelentései a legmeghatározóbbak az Egyesült Államokban. Az indexet telefonos interjúkra alapozva készítik el, mely módszertani alapjait a magyar származású pszichológus, George Katona fektette le még a múlt század ötvenes éveiben.
A Michigan-i fogyasztói hangulat index nagyon népszerű lett pénzügyi körökben, mivel jó előrejelzője a költési hajlandóságnak.
Marta Lachowska Expenditure, Confidence, and Uncertainty: Identifying Shocks to Consumer Confidence Using Daily Data című tanulmányában megerősíti ezt az összefüggést, ugyanakkor felhívja a figyelmet arra is, hogy a fogyasztói szentiment információtartalma eltér mind a gazdasági hírektől, mind pedig a költési görbétől (habár ahogy a fenti ábra is mutatja, kb. együtt mozognak).
Tyúk vagy a tojás? - avagy a közhangulat hat a hírekre, vagy fordítva?
Mark Doms és Norman Morin Consumer Sentiment, the Economy, and the News Media című tanulmányukban megpróbálták megfejteni milyen összefüggés van a hírek és a fogyasztói hangulat alakulása között. A szerzők a The Economist R-Word Indexét "turbózták fel" több forrással és ezt vetették össze a Consumer Sentiment Index grafikonjával. A sárga oszlopok a válságokat jelzik, amennyiben ezeken belül csökkenést mutat a felső (Consumer Index) ill. emelkedést az alsó (R-Word Index) grafikon, akkor helyesen azonosította a trendet. Látható, hogy kb. együtt mozog a két görbe (igaz az elmozdulás iránya ellentétes!) de jelent-e ez oksági kapcsolatot? Ha igen, akkor a sajtó hat a fogyasztókra, vagy fordítva? Persze ez a mi volt előbb, a tyúk vagy a tojás kérdésére hasonlít. Ezzel a szerzők is tisztában vannak, és az alábbi ábrával szemléltetik, milyen összetett kapcsolat áll fent az egyének hangulatának alakulása és a sajtóban megjelenő tartalmak között.
A gordiuszi csomót átvágva Doms és Morin arra koncentrál, hogy a média miképp hat az aggregált szentiment kialakulására. Úgy találták, hogy három faktor különíthető el, az információ maga, a hír hangneme és annak valószínűsége, hogy a hír hatására valaki megváltoztatja hangulatát. Azonban a fogyasztók nem figyelik állandóan a médiát, ezért nem reagálnak ugyanakkor. További érdekesség, hogy a recesszió megjelenésekor egy pillanatig nem történik semmi, majd hirtelen úgy tűnik, hogy mindenki hozzáigazítja a várakozásait a kialakult helyzethez. Az szentiment változásának két legmeghatározóbb eleme viszont nem maga a hír, hanem annak hangneme és volumene (azaz hányszor hangzott el). Ezek alapján úgy tűnik, hogy online hírekre alapozva egész jól meg lehet tippelni a fogyasztói hangulat alakulását, vagy Lachowska érvelését elfogadva, annak azon részét, mely információtartalmát a hírekből nyeri.
A hírek meglepően jól jelzik előre a fogyasztói szentimentet!
David Fan Predicting the Index of Consumer Sentiment When It Isn't Measured című tanulmányában arra tesz kísérletet, hogy egy hírkorpuszra alapozva jelezze előre a vásárlói hangulatot. Ahogy a fenti ábra mutatja, jó eredményeket sikerült elérnie (a tanulmányban több modellel is sikerült ez neki!). A grafikonokon látható pontok a valós szentimentértékek, a folytonos görbe pedig a predikció. Nyugodtan hátra is dőlhetnénk, hiszen a jelek szerint az R-Word Index javított változatával helyettesíthető egy fogyasztói index. Fan azonban maga is szembesült avval a problémával, hogy egyes kiadók meggondolják magukat és akár visszamenőlegesen is törlik szabadon hozzáférhető tartalmaikat egy archívumból. Manapság egyre több kiadó fontolgatja az ingyenes tartalmak körének szűkítését, vagy a teljesen fizetős modell kialakítását. Így a módszer igen költségessé válhat, használata akár meg is haladhatja a telefonos panelvizsgálat költségeit. A másik probléma elméleti; Lachowska szerint két különböző vizsgálat (hírelemzés és vásárlói hangulat mérése) eredményei nem hordozhatnak teljesen azonos információtartalmat. Továbbá Doms és Morin is azt sugalja, hogy a média és a fogyasztók között létezik valamilyen visszacsatolási folyamat, amit a fenti módszerekkel nem tudunk megragadni.
A közösségi média emócióelemzése is jó prediktor!
A blogunkon korábban már bemutatott SmogFarm tartalomelemző cég a Gallup Daily Mood Indexéhez hasonló jelentést készít, melyhez a közösségi médiában fellelhető nyilvános tartalmakat elemzi. A módszer a szentiment elemzés új irányát jelentő ún. emócióelemzésre támaszkodik és Pennebaker eljárását alkalmazza. Az egyes bejegyzéseket nyelvi jellemzőik alapján sorolja be emocionális kategóriákba, majd ún. döntési fa módszerrel alakítja ki az aggregált értékeket. Ahogy az alábbi ábra is mutatja, a két index között nagy korreláció áll fent.
De mindig van egy de...
Minden szépnek tűnik és úgy néz ki, hogy mind a közösségi média, mind az online sajtó alkalmas alapanyag a vásárlói hangulatindexek helyettesítésére. Ne feledjük azonban, hogy a közösségi tartalmait nem vizsgálhatjuk historikus adatokon (a Facebookot 2004-ben, a Twittert pedig 2006-ban alapították) a The Economist R-Word Index viszont arra int minket, hogy a hírek nem minden esetben jó előrejelzők! A Long Term Capital Management igazgatóságában hiába ült két Nobel-díjas közgazdász is, a cég tönkrement. A szofisztikált matematikai modellre épülő befektetési stratégiájukba nem építettek bele kellő mennyiségű historikus adatot s így alábecsülték a várható kockázatokat. Így számolnunk kell azzal, hogy a historikus adatok hiányában az online tartalmak elemzése nagy bizonytalanságot hordoz magában.
Úgy tűnik a nyelvi információ nem tükrözi le teljesen a vásárlói hangulatot, ahogy maga a vásárlói hangulat sem képezi le teljesen a tényleges vásárlói viselkedést. Hogy miért van ez? Valószínűleg nem direkt hazudnak random páran, hogy torzítsák az eredményeket és bizonyára sok tényező szerepet játszik ebben (pl. ahogy említettük, az emberek nem folyamatosan igazítják hangulatukat a hírek tükrében, amikor nagy változás következik be, akkor pedig egy pillanatra "megmerevedik" a helyzet). Talán ezen torzító tényezők közé tartozik maga a nyelv is. A Pollyanna jelenséget bemutató posztjainkban már említettük, hogy a pozitív töltetű szavak gyakorisága magasabb, mint a negatívaké. Ez avval is jár, hogy a negatív szavak információtartalma magasabb, s így amikor egy negatív hír megjelenik, gyorsabban tud terjedni és jobban is tartja magát a köztudatban. Egy későbbi posztunkban ezt a jelenséget még alaposabban fogjuk elemezni blogunkon.