HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Kultúrafüggetlenség kontra kontextusfüggés, avagy Ekman "veszélyes" elmélete

2015.07.07. 09:00 Szerző: Szabó Martina Katalin Címkék: nyelvészet pszichológia szemantika pragmatika nyelvtechnológia kognitív nyelvészet Ekman szentimentelemzés emócióelemzés

A jelen posztban csoportunk eddigi emócióelemzési kutatómunkájához kapcsolódunk, és az érzelmek szövegszintű kivonatolásának elméleti alapvetését szeretnénk alaposabban górcső alá venni. 

Amint arról már több konferencián, cikkben és poszban is szóltunk (l. például a Nyelv, kultúra, társadalom konferencia előadás slide-ok, a Racionalitás, érzelmek, nyelv, a MANYE-n voltunk vagy a Miért foglalkozunk emócióelemzéssel és politikai blogokkal? című bejegyzéseinket),  arra törekszünk, hogy hatékony megoldást találjunk az érzelmeket kifejező szövegelemek automatikus kiszűrésére és feldolgozására. Hogy miért tartjuk mi ezt a feladatot ennyire fontosnak, azt ebben a bejegyzésben nem részletezzük, inkább majd külön posztot szentelünk a témának. Annyit mindenesetre itt is hangsúlyozni szeretnénk, hogy a szövegekben rejtőző emóciók megismerésétől olyan információkat remélhetünk, amelyet a szentimentelemzéstől nem. Az emóciók kivonatolása tehát egy másfajta, esetlegesen a szentimentelemzés eredményét kiegészítő gazdasági haszonnal szolgálhat.   

Ahhoz, hogy az érzelmeket ki tudjuk szűrni a szövegekből, nyilvánvalóan mindenekelőtt meg kell határoznunk azt, hogy mit is keresünk. Kézenfekvő megoldás, hogy olyan nyelvi kifejezéseket igyekezzünk megtalálni, amelyek egyértelműen egyik vagy másik érzelemtípushoz tartoznak. Nézzünk néhány valós nyelvi példát a netről!

1. XDDDDDDD hát hallod téged még egy ártatlan mosolygós fej is felmérgel.:)

2. Még mindig retteg a színésznő, ezért fordult a nyilvánossághoz. 

Úgy tűnik, hogy érdemes az itt kiemelt elemeket összegyűjteni, és aszerint szótárakba rendszerezni, hogy azok mely emóció kifejezésére szolgálnak, tehát mely érzelem meglétét jelölik. Ahhoz azonban, hogy ezeket az emóciókifejezéseket rendszerezni tudjuk, értelemszerűen meg kell határoznunk a kategóriákat, vagyis azt, hogy milyen rendszer szerint kívánjuk a kifejezéseket osztályozni. És itt jön a következő kézenfekvő lépés a nyelvész számára: keressük meg, mit mond a pszichológia, milyen érzelemkategóriákkal érdemes foglalkozni!

Az emócióelemzésnek e fentebb vázolt metódus jelenleg a kitaposott útja - már ha a nem túl magas számú nemzetközi, és még csekélyebb számú hazai publikáció mellett egyáltalán lehet kitaposott útról beszélni. Az emóciókat elemző nyelvtechnológus megnézi a pszichológia vonatkozó eredményeit, és megtalálja Paul Ekman elméletét. Ekman azt mondja, hogy hat olyan, ún. alapérzelem van, amelynek arckifejezései a vizsgálati eredmények alapján kultúrafüggetlenül azonosíthatóak, azaz ezek arckifejezései a világon minden ember számára ugyanazt az érzelmi állapotot (bánat, düh, félelem, meglepődés, öröm és undor) tükrözik

emitiou.jpg

Az 1970-es években azután Ekman, Friesennel együtt kidolgozta az ún. Arctevékenység-kódoló Rendszert, röviden a FACS rendszert. A módszer, amely több évtizednyi kutatás eredménye, feltérképezi az arc 23 pár izmának mozgását, s ezen apró mozgások elemzése alapján megállapítja, hogy az adott személy éppen milyen érzelmi állapotban van. Az elemző precizitását mutatja, hogy a segítségével az igazi és a színlelt érzelmeket is pontosan el lehet különíteni egymástól.

Nem csoda hát, ha a Time magazin 2009-ben Ekmant a világ 100 legbefolyásosabb emberének sorába választotta. 

lie-to-me-production-aug-2008-download-2-087.jpg

Paul Ekman és a Hazudj, ha tudsz! című tévésorozat sztárja, Tim Roth

(www.paulekman.com) 

Az ekmani elmélet átütő sikeréből következően a nyelvtechnológiai emócióelemzés is alapvetően ebből a kategorizálásból építkezik. A legtöbb vonatkozó dolgozat vagy egyenesen az ekmani hat alapemóció mentén csoportosítja az értelemkifejezéseket (l. pl. Liu et al. 2003; Alm et al. 2005; Neviarouskaya et al. 2007 a,b; Aman-Szpakowicz 2007), vagy ezeket alapul veszi, majd néhány egyéb csoporttal kiegészíti azt (pl. a vonzalom vagy a feszültség kategóriáival, ahogyan újabban például magunk is teszünk, l. Szabó et al. 2015). Annyira meggyőző érv ugyanis az, hogy ezek az érzelemtípusok kultúrafüggetlenek, hogy a számítógépes nyelvész bele sem gondol: Vajon valóban ez az a sajátság, amire nekünk szükségünk van? Illetve, vajon nem takar-e el ez (az egyébként nyilvánvalóan fontos) tény olyan jellegzetességeket a számítógépes nyelvész szeme elől, amely dugába döntheti az elemző munka eredményét?

Azt ígértem a poszt címében, hogy Ekman "veszélyes" elméletéről fogok írni. Nos, ezzel a jelzővel Daniel C. Dennett Darwin's dangerous idea (1995) című művére kívántam rájátszani, és az "ekmani veszélyre" igyekeztem rámutatni. Dennett két okból nevezi a darwini elméletet veszélyesnek: Egyrészt, mert Darwin gondolata alapjaiban forgatta fel a hagyományos kozmológiai gondolkodást, miszerint az ember kitüntetett szereppel bír a létezők sorában, sőt alapjaiban kérdőjelezte meg azt, hogy magának az életnek is egyáltalán kitüntetett ontológiai státusza volna. Másrészt, Dennett arra is rá kíván mutatni, hogy (véleménye szerint) sokan rosszul értelmezik Darwint az elmélete könnyű félreérthetősége okán, s ez a félreértelmezhetőség veszélyessé teszi azt. Ekman elmélete azért "veszélyes", mert annak kultúrafüggetlenül érvényes volta olyannyira meggyőző erejű, hogy hajlamosak vagyunk az emóciókifejezések - és legyenek azok most arc- vagy nyelvi kifejezések - egyéb sajátságaira már különösebb figyelmet nem is fordítani.

Az egyik ilyen sajátság a kontextus szerepe az emóciókifejezések interpretálásában. És itt nem feltétlenül szövegek elemzéséről van szó. Nézzük meg a jelenséget közelebbről is!

Barrett és szerzőtársai (Barrett et al. 2007) dolgozatukban egy a téma szempontjából igen érdekes fotóra hívják fel a figyelmet. A fényképet Jim Webbről, az Amerikai Egyesült államok szenátoráról készítették, miközben a 2007-es választási győzelmet ünnepli. A pszichológiai kísérletek azt mutatják, hogy amennyiben a szenátor arcát önmagában, a kontextusa nélkül látják az alanyok (l. (a) lentebb), arról azt a megállapítást teszik, hogy a férfi arckifejezése agressziót és haragot tükröz. Amennyiben azonban a szenátor arcát a kép eredeti formájában, a teljes kontextusban mutatják meg az alanyoknak (l. (b) lentebb), úgy azok örömöt és izgatottságot vélnek felfedezni rajta.   

nihms37844f1.jpg

A vizsgálat eredménye különösen figyelemre méltó, ha meggondoljuk, hogy a szenátor arckifejezését a vizsgálati személyek egyáltalán nem érzékelik  félreérthetőnek, többértelműnek, hanem automatikusan és bármiféle megerőltetés nélkül jutnak ellentétes megállapításra.

Barrett (Barrett et al. 2007) a jelenségre paradoxonként utal, hiszen mégiscsak elég paradoxális, ha van hat, egymástól biológiai jegyeiben jól elkülöníthető, emellett univerzális arckifejezés, amelynek interpretációja, mindennek ellenére, akár teljes mértékben kontextusfüggő lehet. A szerzők megpróbálnak valamiféle magyarázatot adni a jelenségre, és dolgozatukban a szavak mint a kategóriaképzés eszközével operálnak, véleményem szerint azonban elméletük nem ad megnyugtató választ.

Ugyanakkor, (talán az ekmani kategóráiákért cserébe?) most mintha a nyelvészet kölcsönözne elméleti keretet a pszichológiának. 

Az elméleti keretet egészen Wilson és Sperber (2004) pragmatikájáig kell visszavezetnünk. Wilson és Sperber (2004) azt mondja, hogy a megnyilatkozás kommunikált tartalma messze túlmutat azon a tartalmon, amelyet a puszta nyelvi elemek és szerkezetek kódolnak, ezért a jelentést a hallgatónak kell kidolgoznia az aluldeterminált jelentésből a kontextus alapján. Mindez a lexikai pragmatika elméleti keretében azt jelenti, hogy maga a puszta lexéma csupán alulspecifikált szemantikai reprezentációval rendelkezikEnnek következtében a lexéma a teljes jelentését majd csak a kontextusban nyeri el (vö. Bibok 2014). De honnan van mégis ez az aluldeterminált jelentés? Nyilvánvalóan lennie kell egy pragmatikai tudásnak, amely a kódok kidolgozásához szükséges enciklopédikus információkat tartalmazza. 

 

Mindez igen bonyolultan hangzik, ezért nézzünk meg néhány példát az elmélet működésére a szentiment- és emóciókifejezések megértése területéről!

3.a. Őrizetben a brutális kettős gyilkosság gyanúsítottja (mno.hu)

b. Félelmetes élményben volt része egy amerikai nőnek, aki Dél-Afrikában, a Mossel-öbölben vett részt egy ketreces cápamegfigyelésen. (www.erdekesvilag.hu)

4. Bemutatkozott a brutális Volkswagen GTI Supersport Vision Gran Turismo (...) Egy félelmetes ferdehátú, amely egy másik nézőpontból kelti életre a „GTI” koncepcióját. (http://auto-live.hu/)

Az fentebb vázolt elképzelés szerint a (3a) és (3b) mondatok esetében a kiemelt szavak megértése a pragmatikai tudásunkban lévő enciklopédikus információkra támaszkodva történik. Mindez azt jelenti, hogy van valamilyen, az eddigi tapasztalatainkon alapuló elképzelésünk arról, hogy milyen az, ami brutális, és milyen az, ami félelmetes. Ez tulajdonképpen az az enciklopédikus információ, amelyet a vizsgált kifejezések alulspecifikált szemantikai reprezentációi magukban foglalnak, és ezekre a számunkra már rendelkezésre álló információkra támaszkodva azt is meg tudjuk fejteni, hogy mit takarnak ezek a kifejezések ezekben az aktuális kontextusokban. Ugyanakkor, a (4) alatti példa esetében ez az enciklopédikus információ nem áll összhangban teljes mértékben az aktuális kontextussal, tehát az alulspecifikált szemantikai reprezentációban foglalt enciklopédikus információ nem elegendő a számunkra, ezért „távolabbi” enciklopédikus információk elérésére van szükség. A (4) alatti példa esetében ez a "távolabbi" információ a brutális és félelmetes kifejezések affektív jegye. Azt mondjuk tehát, hogy ebben és az ehhez hasonló esetekben a vizsgált lexémák prototipikus vagy sztereotipikus jelentése helyett annak puszta affektív vagy intenzitási szemantikai jegye aktiválódik az interpretáció során. Még egyszerűbben: nem arra a következtetésre jutok, hogy a Volkswagen e típusa úgy brutális, mint egy gyilkosság, és rettegnem kell tőle, hiszen félelmetes, hanem arra, hogy annyira hatásos, lehengerlő és meglepő, mint - hogy úgy fogalmazzunk - "amekkora" affektív jegy van a brutális és a félelmetes kifejezésekben.  

Ha meggondoljuk ezt az interpretálási folyamatot, könnyen felfedezhetünk egyfajta párhuzamot a szövegszintű emóciókifejezések, valamint az emóciók arckifejezéseinek a megértése között. Hiszen nem lehet nem észrevenni, hogy mennyire hasonlít egymásra az a két jelértelmezési folyamat, amelynek során képes vagyok megfelelően, a  prototipikus vagy sztereotipikus jelentéstől eltérően, a puszta affektív szemantikai sajátság alapján interpretálni jelen esetben például a brutális szót az ezt a fajta interpretációt megkívánó kontextusban, és, hogy képes vagyok az egyébként, kontextus nélkül a számomra a harag egyértelmű jegyeit mutató szenátori arcot az izgatottság és az öröm kifejeződéseként interpretálni az ezt a fajta értelmezést megkívánó kontextusban. 

Persze a fentebb bemutatott elméleti párhuzamot nem ok nélkül tárgyaltam - bár kétségtelen, hogy izgalmas és mindenképpen megfontolásra érdemes elképzelés önmagában is. Azt szerettem volna mindenekelőtt megvilágítani, hogy amíg az emócióelemzők (és áruljuk el: a szentimentelemzők is) gyakorta alapvetően a kategóriarendszerre, a rendszerezés problémáira és lehetőségeire fókuszálnak, elsikkadnak olyan jelentős kérdések fölött, mint jelen esetben például a kontextus szerepe a nyelvi (és az arckifejezések esetében nem nyelvi) jelek megértésében. Így pedig egy helytálló, és akár a nyelvtechnológiában és sikerrel alkalmazható pszichológiai elmélet is könnyen "veszélyessé"  válhat.           

IRODALOM

Alm, C.O.-Roth, D.-Sproat, R. 2005. Emotions from text: machine learning for textbased emotion prediction. In Proceedings of the Joint Conference on Human Language Technology / Empirical Methods in Natural Language Processing (HLT/EMNLP 2005). Vancouver, Canada. 579-586.

Aman, S.-Szpakowicz, S. 2007. Identifying Expressions of Emotion in Text. In Proceedings of the 10th International Conference on Text, Speech, and Dialogue (TSD- 2007), Plzeň, Czech Republic, Lecture Notes in Computer Science (LNCS). SpringerVerlag. 196-205.

Barrett, L.F.-Lindquist, K.A.-Gendron, M. 2007. Language as context in the perception of emotion. Trends in Cognitive Sciences 11. 327-332.

Bibok, K. 2014. Lexical semantics meets pragmatics. Argumentum 10. Debreceni Egyetemi Kiadó. 221-231.

Ekman, P.-Friesen, W.V. 1969. The repertoire of nonverbal behavior: Categories, origins, usage, and coding. Semiotica 1. 49-98.

Ekman, P.-Friesen, W. V.-Ellsworth, P. 1982. What emotion categories or dimensions can observers judge from facial behavior? In P. Ekman Ed. Emotion in the human face. New York: Cambridge University Press. 39-55.

Liu, H.-Lieberman, H.-Selker, T. 2003. A Model of Textual Affect Sensing using RealWorld Knowledge. In Proceedings of the International Conference on Intelligent User Interfaces, IUI 2003, Miami, Florida, USA.Wilson, D.-Sperber, D. 2004. Relevance Theory. In Ward, G.-Horn, L. eds. Handbook of Pragmatics. Oxford, Blackwell. 607−632.

Neviarouskaya, A.-Prendinger, H.-Ishizuka, M. 2007a. Analysis of affect expressed through the evolving language of online communication. In Proceedings of the 12th International Conference on Intelligent User Interfaces (IUI-07). Honolulu, Hawaii, USA. 278-281.

Neviarouskaya, A.-Prendinger, H.-Ishizuka, M. 2007b. Narrowing the Social Gap among People involved in Global Dialog: Automatic Emotion Detection in Blog Posts, In Proceedings of the International Conference on Weblogs and Social Media (ICWSM 2007). Boulder, Colorado, USA. 293-294. 

Szabó M.K.−Vincze V.−Morvay G. 2015. Magyar nyelvű szövegek emócióelemzésének elméleti nyelvészeti és nyelvtechnológiai problémái. Nyelv – Nyelvtechnológia – Nyelvpedagógia: 21. századi távlatok. 25. MANYE-kongresszus, Budapest

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr147585742

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása